ChatGPT 的深入研究就在這里。但它真的能取代人類專家嗎？

OpenAI 的 '深入研究' 是最新的人工智能（AI）工具掀起波瀾并承諾在幾分鐘內完成人類專家需要數小時才能完成的工作。

作為 ChatGPT Pro 和銷售作為可以匹配訓練有素的分析師的研究助理，它可以自主搜索 Web、編譯來源并提供結構化報告。它甚至得分26.6% 的 Humanity's Last Exam （HLE），這是一個嚴格的 AI 基準測試，跑贏大盤許多型號。

但深入的研究并不完全符合炒作。雖然它生成的報告很精美，但也存在嚴重的缺陷。據記者報道誰嘗試過，深入的研究可能會錯過關鍵細節，與最新信息作斗爭，有時還會捏造事實。

Open AI 的深度研究助手可以處理數據，但不能像人腦那樣了解事物。(伊納基·德爾·奧爾莫/Unsplash)

OpenAI 在列出其工具的局限性時標記了這一點。該公司還表示“根據內部評估，有時會在回答中產生幻覺或做出錯誤的推斷，盡管其比率明顯低于現有的 ChatGPT 模型”。

不可靠的數據可能會溜進來也就不足為奇了，因為 AI 模型不像人類那樣“了解”事物。

人工智能“研究分析師”的想法也引發了一系列問題。機器 - 無論多么強大 - 真的可以取代訓練有素的專家嗎？這對知識工作有什么影響？AI 真的是幫助我們更好地思考，還是只是讓我們更容易完全停止思考？

什么是“深度研究”，它適用于誰？

深入研究面向金融、科學、政策、法律和工程領域的專業人士，以及學者、記者和商業戰略家，是最新的”代理經驗“ OpenAI 已在 ChatGPT 中推出。它承諾在幾分鐘內完成繁重的研究工作。

目前，深度研究僅適用于美國的 ChatGPT Pro 用戶，每月費用為 200 美元。開放人工智能說它將在未來幾個月內向 Plus、Team 和 Enterprise 用戶推出，并計劃在未來推出更具成本效益的版本。

與提供快速響應的標準聊天機器人不同，深度研究遵循多步驟流程來生成結構化報告：

乍一看，它聽起來像是知識工作者的夢想工具。仔細觀察會發現明顯的局限性。

多早測試暴露出的缺點：

雖然 OpenAI 聲稱其工具可與人類分析師相媲美，但 AI 不可避免地缺乏使優秀研究有價值的判斷力、審查力和專業知識。

ChatGPT 并不是唯一一個只需幾個提示就可以搜索網絡并生成報告的 AI 工具。值得注意的是，僅僅OpenAI 發布 24 小時后中，Hugging Face 發布了一個免費的開源版本，其性能幾乎與之相當。

深度研究和其他用于“人類水平”研究的 AI 工具的最大風險是 AI 可以取代人類思維的錯覺。AI 可以總結信息，但它不能質疑自己的假設、突出知識差距、創造性思考或理解不同的觀點。

AI 在建立對復雜研究問題的深刻理解方面尚未超越人類。(伊利亞·哈伊爾/Unsplash)

AI 生成的摘要與深度的熟練人類研究人員。

任何 AI 代理，無論多快，都只是一種工具，而不是人類智能的替代品。對于知識工作者來說，投資于 AI 無法復制的技能比以往任何時候都更加重要：批判性思維、事實核查、深厚的專業知識和創造力。

如果您確實想使用 AI 研究工具，有一些方法可以負責任地這樣做。深思熟慮地使用 AI 可以在不犧牲準確性或深度的情況下增強研究。您可以使用 AI 來提高效率，例如總結文檔，但保留人工判斷來做出決策。

始終驗證來源，因為 AI 生成的引用可能會產生誤導。不要盲目相信結論，而是應用批判性思維并與信譽良好的來源交叉核對信息。對于高風險主題 — 例如健康,正義和民主— 用專家意見補充 AI 發現。

盡管大量的營銷試圖告訴我們并非如此，但生成式 AI 仍然有很多局限性。能夠創造性地綜合信息、挑戰假設和批判性思考的人類將繼續受到需求——AI 目前還不能取代他們。

Raffaele F Ciriello，商業信息系統高級講師，悉尼大學

本文轉載自對話根據 Creative Commons 許可。閱讀原創文章.

本站所有相關知識僅供大家參考、學習之用，部分來源于互聯網，其版權均歸原作者及網站所有，如無意侵犯您的權利，請與小編聯系，我們將會在第一時間核實并給予反饋。

相關期刊推薦