隨手拍張照,AI就知道在哪! 人類在AI面前已裸奔

京港台:2025-4-27 23:05| 來源:新智元 | 評論( 3 )  | 我來說幾句

隨手拍張照,AI就知道在哪! 人類在AI面前已裸奔

來源:倍可親(backchina.com)

  

  新智元報道

  【新智元導讀】OpenAI的 o3看照片識位置的功能,簡直令人毛骨悚然!Django Web大神Simon Wilson發現,o3憑藉Python代碼,就能破解自己照片的地理位置。這實在太反烏托邦了,人類的地理信息,對於AI已經完全透明了?

  OpenAI的o3發布以來,這個功能讓不少網友覺得毛骨悚然——

  它能準確破解你的地理位置!

  就在剛剛,Lanyrd聯創、Django Web框架締造者Simon Wilson專門發了一篇博客,詳盡推敲了o3究竟是如何猜測照片拍攝地點的。

  

  他將整個過程評價為:既超現實,又反烏托邦,彷彿幾十年前的科幻小說突然變成現實!

  已經有越來越多網友發現,o3識圖定位的功能,堪稱瘋狂。

  

  

  隨便拍張照片,o3就告訴你這是哪裡

  首先,我們可以試著隨手拍一張照片,最好是沒有明顯的地標性建築。

  然後把照片傳給o3或o4-mini,問它:「猜猜這張照片是在哪兒拍的?」

  注意,一定要關閉ChatGPT的記憶功能,否則它就會使用此前對話的上下文作弊。

  實驗開始!

  Wilson給了o3一張照片,是他在加州El Granada家裡附近一個露天酒吧拍的。

  他覺得這張照片很有挑戰性,沒什麼明顯的特徵。只有一小段路、兩棟普通的房子,還有遠處的、只能看到一點輪廓的小山。

  

  要是讓人來通過這張照片確定拍攝地點的話,確實是很有挑戰,相信絕大多數人甚至都會直接放棄。

  因為實在是沒什麼明顯的標記物。

  但是o3沒管那麼多,拿著圖片就開找了起來。

  Wilson分享了o3思考的整個過程,一共花了6分48秒。

  它從一個有一點奇怪的錯誤開始了調查,先是假裝根本看不到這張照片。

  

  然後突然恢復視力。

  

  分析了照片后,o3打起了照片中車牌的主意。不過這個車牌很模糊,肉眼很難分辨。

  o3也在思考中分析需要將其放大處理。

  

  為了確定車牌在照片中的位置,o3開始變身程序員寫起了代碼。

  

  找到車牌位置並且放大后,o3開始了更加細節的分析。比如,他開始觀察車牌的樣式。

  

  對於自己關注的細節,o3會進行誇張的放大。

  

  在這個過程中,不斷生成代碼配合其分析。

  

  o3會把它「看到」的細節與浮現在自己「腦海中」的印象做對比。

  

  在這樣仔細地思考了6分多鐘后,終於給出了它的最終答案。

  

  結果怎麼樣呢,加利福尼亞中央海岸完全正確。

  不過距離o3的第一猜測Cambria大約有200英里的偏差,但是它的下一個猜測El Granada準確無誤。

  Claude推理粗糙,Gemini直接作弊

  Simon Wilson也說,o3不是唯一能做這個的模型,他也在Claude 3.5和3.7 Sonnet上做過類似的事情。

  只不過它們沒有o3那種誇張的「放大」能力。

  不斷地對圖片放大到底有多大用?

  Wilson猜測模型的視覺輸入解析度可能比較低,所以對圖像做一些裁剪確實會有幫助。

  但o3對一張照片進行25次的裁剪操作,確實像是有點炫技的感覺。

  Simon Wilson還貼出了Claude 3.7 Sonnet的「擴展思考」結果,它給出的答案是「加州沿海的一個中小型城鎮」。

  跟o3比起來,Claude的這個思考過程顯得「粗糙不堪」。

  

  而Gemini直接開始了作弊:「鑒於當前的定位是加州埃爾格蘭納達……」。

  所以Simon Wilson不得不通過API試了Gemini 2.5 Pro,結果它自信滿滿地猜錯了,認為是「加州卡尤科斯The Hidden Kitchen餐廳的露台」。

  

  o3的不同之處在於工具使用(圖片處理、python等)被整合進了「思考」階段。

  這非常驚艷。

  不過Wilson也承認,這也挺令人不安的。

  技術現在已經能通過照片識別地點了。人們必須明白哪怕是平淡無奇的照片,都可能被用來識別出你的位置。

  

  等等,o3難道也作弊了?

  對於這個過程,有人提出了質疑:o3是不是本來就可以訪問一個大致的位置模型,能知道用戶在哪裡?

  Simon檢查后發現,它居然真的知道自己的地理位置。

  如果去問o3:你知道我在哪裡嗎?請儘可能多地提供技術細節。

  它給出的答案,具體到在加州的半月灣,甚至包括時區、經緯度、地理標識符、海拔、氣候分類等等。

  Simon猜測,或許這是它增強搜索功能的一部分。

  

  不過隨後的嘗試,讓Simon對o3更有信心了——即使沒有這個位置模型,o3依然可以準確猜出地理位置。

  比如,他給了o3一些距離自己實際位置有幾千英里的照片,並且通過截圖去除了EXIF信息。

  下面這張照片,是在馬達加斯加的鄉村拍的。

  

  但o3依然給出了準確的判斷。

  

  這張照片,是在布宜諾斯艾利斯城市區拍的。

  

  模型也認出了它的地理位置。

  

  所以,o3在這方面,的確有某些過人之處,似乎並不是靠作弊。

  

  CSI走進現實

  Simon Willison表示,看著模型在處理照片的思考過程,彷彿就像在看一集《犯罪現場調查》。

  它會不斷平移、縮放,討論各種可能的位置。

  但是,這也讓人感到深深的反烏托邦氣息。

  現在的AI,完全可以通過照片輕易識別出你的具體位置了。

  所以,你很有必要警惕起來,時刻注意自己的人身安全!

  

  

  搜餐館、搜位置,o3無所不能

  其實早在上周,o3和o4-mini剛發布時,就有無數網友發現,這兩個模型也太神了。

  僅憑一張無EXIF信息的菜單或風景照,它就能精準推理、反向定位拍攝地點,直接引爆了全網AI玩「照片定址(GeoGuessr)」的新熱潮。

  開始,人們以為它們只是很擅長圖像匹配而已,但完全不止於此——它們會展開推理,在網上進行瘋狂的搜索,直到找出正確答案為止!

  可以說,只要你的照片向AI暴露,你的信息就不再是隱私了。

  

  知名投資人Deedy就發現,只給一張沒有標題及EXIF數據的菜單圖片,o3就能夠上網搜索、匹配菜單項,找到這家中餐館的位置。

  

  

  o4-mini也是如此。

  

  

  而o3精準定位照片地理信息的本領,簡直是令人毛骨悚然。

  比如給出下圖左邊這張從室內窗戶向外拍攝的海岸景色。

  根據就照片里透露的信息,只能看到長長的沙灘、蜿蜒通往海灘的階梯步道、遠處的海岬以及近處的一些植被。窗邊還有一個插著花的花瓶。

  所有信息就這麼多了。

  

  但是o3居然猜出了照片拍攝地:很可能在加州奧蘭治縣達納角 (Dana Point) 的麗思卡爾頓拉古納尼格爾酒店 (Ritz-Carlton Laguna Niguel) 內,可能是在RAYA或180blũ餐廳附近。

  可怕的是,它居然猜對了!

  它是怎麼判斷的?是通過以下匹配的特徵。

  西北-東南走向、長而平緩彎曲的鹽溪海灘 (Salt Creek Beach)。

  從酒店通往公共海灘的米色、之字形的露台式步道和樓梯。

  海灘內陸的草地,即帝王海灘高爾夫球場 (Monarch Beach Golf Links)。

  遠處的岩石海岬(達納角海岬)。

  甚至,o3還給出了酒店的地址(One Ritz-Carlton Drive, Dana Point, CA 92629)和大致的經緯度坐標(北緯 33.482°,西經 117.721°)。

  網友用谷歌地圖確認了一下,答案完全正確。

  大膽暢想一下,如果o3的圖像識別能力再疊加一個無敵的全球資料庫,這個AI豈不是能認出地球上的任何地方?

  接下來,網友們紛紛上傳自己的照片,讓o3猜位置。

  比如下面根據下面這張,o3就猜出是在亞利桑那州佩森市(Payson, Arizona)北部的Water Wheel Falls / Ellison Creek Cascades。

  

  它是怎麼猜出來的呢?推理邏輯和關鍵線索如下。

  視覺線索: 淺層滑梯式瀑布,落差約15英尺,落入深色水潭——匹配點: Water Wheel Falls有類似的傾斜花崗岩水道流入翠綠水池。

  視覺線索: 粉褐色花崗岩壁,帶有垂直裂縫——匹配點: 這是該峽谷標誌性的莫戈隆邊緣(Mogollon Rim)花崗岩。

  視覺線索: 瀑布底部橫卧著一根巨大的漂白原木——匹配點: Water Wheel Falls有一根標誌性的「階梯狀」原木,已在那裡停留多年(引用了The Outbound的信息)。

  視覺線索: 瀑布上方有稀疏的河岸灌木和亞利桑那松林——匹配點: 這是埃里森溪(Ellison Creek)走廊的典型植被。

  現在,網友們給o3的考驗還在升級。

  英偉達研究員Zhaocheng Zhu給了o3一組他用長焦鏡頭拍攝的照片,沒有EXIF數據,關閉o3的記憶功能。

  

  因為網上大多數照片都是用廣角鏡頭拍的,所以這張照片對o3來說應該非常棘手。

  Zhu本人表示,如果不是透過鏡頭看到這個角度,自己也認不出來這個地方是哪兒。

  結果,o3猜對了。

  

  對於這張,它不僅準確找到了拍攝地點,還認出了圖中的山峰是聖羅莎山脈。

  

  繼續加大難度后,o2猜測了三個地點,其中一個就是正確答案——查爾瓦高地。

  

  終於,在猜測這張照片的時候,o3翻車了。這是一張加拿大山脈的鳥瞰圖,o3卻認作是瑞士的阿爾卑斯山。

  這大概是因為,航拍照片在訓練集中所佔的比例很低。

  

  而且,o3可不止強在猜測國外的地理位置,有國內開發者給了它自己上班路上隨手拍的一張圖,它居然也一步步準確分析出了位置信息——山東青島市北區重慶南路47號。

  

  

  

  

  

  左右滑動查看

  有人質疑,是否是照片里已經帶定位了?

  Nanyi表示,iPhone拍照說明裡只有拍攝參數,沒有位置參數。

  應該是o3從魯U推理出了青島,從小海豚里搜出了旁邊的店,然後又從百度地圖和青島本地寶里搜出信息、查看附近的郵局,最終確認的。

  

  圖片信息中並沒有位置信息

  注意,這只是2025年的o3模型而已,未來的模型還會做出什麼呢?

        更多科技前沿 文章    >>

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-6-29 12:05

返回頂部