別再信任AI?它連圖都看不懂,還會編造論文!

你有沒有干過這種事——
手頭堆著十幾篇論文看不完,順手扔給AI:
「幫我總結一下核心觀點。」
然後AI叭叭叭吐出一段,你複製粘貼,完事。
如果你干過,接下來的內容,可能會讓你後背一涼。
康奈爾大學和谷歌聯手,搞了一場「AI讀論文」的盲測。
結果出來了——
AI可能根本沒讀懂。
它只是在裝懂。
01. 這場測試,狠在哪兒?

研究人員乾了一件很損的事。
他們先挑了一個連科學家都經常吵架的領域:
高溫銅氧化物超導體。
這玩意兒,人類研究了30多年,論文堆成山,到現在還沒扯清楚。
然後,他們往資料庫里塞了1726篇相關論文。
接著,他們出了67道題。
注意,這不是那種「本文主要研究了什麼」的傻瓜題。
而是需要——
綜合多個研究的結論,
判斷學術爭議的對錯,
甚至要做點科學推理。
說白了:這題是給科學家出的,不是給AI玩的。
02. 參賽選手:五大AI + 12個真人

他們把市面上能叫上名字的AI全拉來了:
ChatGPT-4
Claude 3.5
Perplexity AI
Gemini Advanced 1.5 Pro
NotebookLM
然後又找了12個真正的科學家。
玩法更狠:
盲評。
12個專家只看答案,不知道是人寫的還是AI寫的。
就像《蒙面歌王》,只聽聲音不看臉。
03. 結果:AI露餡了

先說好消息。
能「讀論文」的AI,確實比只會搜網頁的AI強。
比如NotebookLM這種,允許你上傳論文的,回答問題時明顯靠譜。
因為它是在你給的資料里找答案,不是去網上瞎編。
但壞消息更扎心。
AI最大的死穴:看不懂圖。
搞科研的人都知道,論文里最值錢的不是文字,是圖——
曲線圖、相圖、實驗照片、統計表……
很多結論,都在圖里藏著。
未完待續,請點擊「下一頁」繼續閱讀








