倍可親

DeepSeek與OpenAI孰是孰非

作者:國華B  於 2025-1-31 04:46 發表於 最熱鬧的華人社交網路--貝殼村

通用分類:政經軍事|已有16評論

DeepSeek的指控

在DeepSeek發布其驚世駭俗的DeepSeek v3, 尤其是其1月20日發布的r1模型引發美國股市狂瀉后,美國朝野政治和科技界開始了「反思」。回溯DeepSeek的發展史,人們似乎發現了貓膩(下圖 digit)。

微軟和OpenAI調查DeepSeek是否從ChatGPT非法獲取數據(OPENTOOLs/Yahoo)。偏保守的《紐約郵報》(New York Post)在昨天(1月29日)的一篇題為「OpenAI says it has proof DeepSeek used its technology to develop its AI model」的文章中說,特朗普總統的人工智慧和加密貨幣顧問薩克斯(David Sacks)認為,DeepSeek可能竊取了OpenAI的技術(下圖 threads)。

薩克斯在接受福克斯新聞採訪時表示:「人工智慧中有一種技術(即蒸餾distillation 下圖 yahoo),一個模型通過複製其知識從另一個模型中學習。有強有力的證據表明,DeepSeek對OpenAI的模型做到了這一點。」但《紐約郵報》注意到薩克斯並未「沒有提供具體的證據」。 同時,《紐約郵報》還指出,「專家表示,中國和美國的人工智慧初創企業經常使用已建立的人工智慧模型的結果來改進自己的系統。」(Experts say it is common for AI start-ups in China and the US to use results from established AI models to improve their own systems.)

AI中的」fair use」

谷歌發明了變壓器(transformer)架構,OpenAI在transformer的基礎上將其擴展了(scale it up),成就了後來蜚聲全球的ChatGPT語言大模型。但是,《紐約時報》起訴OpenAI和微軟未經許可使用《紐約時報》文章來訓練大語言模型(下圖 RubyMediaGroup)。

《紐約時報》的核心指控是,OpenAI在訓練模型期間未經許可和授權使用和複製(數百萬)《紐約時報》作品,作為大語言模型的訓練材料,侵犯了版權。《紐約時報》列舉的例子中包括一篇發表於2012年關於蘋果全球產業鏈的文章。ChatGPT幾乎是將《紐約時報》的文章一字不漏的生成出來。《紐約時報》認為,OpenAI的行為對高質量新聞報道構成重大威脅 (下圖 SBSTamil)。

OpenAI的律師在答辯時稱,用於其訓練人工智慧機器人的大量數據受到「合理使用」(fair use)規則的保護。所謂「fair use」是美國法律中的一項原則,允許將受版權保護的材料用於教育、研究或評註等目的。OpenAI的最大投資者微軟的律師提出,OpenAI採用《紐約時報》的新聞文本並不違法,因為版權法對大語言模型(LLM)的適用性應該比照錄像機(VCR),或複印機、個人電腦、互聯網、搜索引擎或鋼琴。目前《紐約時報》與OpenAI/微軟的官司仍在繼續當中。另谷歌的Gemini大語言模型也是用百度的文心一言大模型數據來訓練其中文的。在2023年12月18日的一次對Gemini-Pro的測試中,有人問它「你是誰」,Gemini-Pro答稱:我是百度文心大模型。

由總部位於紐約市的Recurrent Ventures媒體公司出版的電子刊物Futurism在1月29日一期中有一篇題為「OpenAI hit with wave of ockery for crying that someone stole its work without permission to build a competiting product」( OpenAI因有人未經許可竊取其作品以構建競爭產品而受到嘲笑 下圖 Futurism)。

文中有一段引用人工智慧評論家Ed Zitron的這麼一段話:「OpenAI這家靠竊取整個互聯網而成立的公司正在哭泣,因為DeepSeek可能已經接受了ChatGPT的輸出訓練。」文章還引用了另一位Bluesky用戶的更為激進的觀點:「如果你竊取了全世界所有的藝術,來製造出欺騙性和不能進行算術運算的技術,並為此收取200美元/每月的費用。而有人竊取了你的技術,然後免費提供這項技術。也許,你並非真正的受害者。」人工智慧評論家Gary Marcus在他的推特X上表示, OpenAI可能也未經許可竊取了YouTube、紐約時報以及無數藝術家和作家的產權。是不是有點尷尬?(下圖 CHANNEL

筆者看來,DeepSeek與OpenAI現在是一損俱損,一榮俱榮的關係。如果OpenAI輸了與《紐約時報》的官司,DeepSeek的「合理使用」也就不成立,我是說如果有確鑿證據證明DeepSeek在訓練中蒸餾了ChatGPT的數據的話。如果OpenAI的「合理使用」得到法官的支持,那OpenAI/Microsoft沒有理由只許州官放火,不讓百姓點燈。己所不欲,勿施於人。OpenAI CEO曾經說過,如果沒有剽竊受版權保護的材料,就不會有OpenAI。現在OpenAI已經閉源,這話是否對別的開源公司更合適呢?你說呢?


參考資料

巴比特. (2024). AI new horizon | daily must-read: Gemini revealed that it used Baidu Wenxin Yiyuan for Chinese language training. AiCoin. 鏈接 https://www.aicoin.com/en/article/380285

Allyn, B. (2025). 'The New York Times' takes OpenAI to court. ChatGPT's future could be on the line. npr radio. 鏈接 https://www.npr.org/2025/01/14/nx-s1-5258952/new-york-times-openai-microsoft



高興

感動

同情

搞笑

難過

拍磚

支持
1

鮮花

剛表態過的朋友 (1 人)

發表評論 評論 (16 個評論)

回復 浮平 2025-1-31 07:08
DeepSeek 面臨的五個挑戰:

1)生成式AI與一致性價值原則 ---
在應用生成式人工智慧時,如何保持公正無偏並基於事實的分析是一大挑戰。尤其在處理敏感信息時,可能由於權力干預導致答案不一致,從而影響結果的可靠性和準確性,特別是在缺乏嚴格倫理規範和透明度的情況下。

2)利益最大化與彎道超車 ---
DeepSeek 的創新可能類似於藝術作品的二次創作,但在技術領域常缺乏核心技術研發積累。過度擴展商業行為可能影響同行關係,並阻礙可持續性發展。

3)倫理規範規則的不明確性 ---
開源技術和共享資源的國際倫理規範尚未明確。隨著商業利益的介入,這些規範的建立將不可避免,必然會帶來新的挑戰。

4)版權問題 ---
若 DeepSeek未能妥善處理版權問題,可能面臨法律訴訟,損害信譽並錯失市場機會。

5)用戶隱私與數據保護 ---
隨著用戶數據隱私保護問題的日益嚴峻,DeepSeek可能會面臨越來越大的監管和市場壓力。
回復 rfw1972 2025-1-31 08:10
太高調容易引起敵人注意,吹過了頭,出了問題就丟死了人。
回復 浮平 2025-1-31 10:14
rfw1972: 太高調容易引起敵人注意,吹過了頭,出了問題就丟死了人。
這次並非因為高調,也沒有那麼多敵人,而是內行看門道的正常反應,客觀檢驗的反饋過程。你假想的」敵人「並沒有以猜疑和惡意動機為依據去拒絕和詆毀,依然按照規則先接納並幫助宣傳,測試,而且股市也隨之動蕩,一步步的發現和提出問題。即想要名,又想要利,還想遮掩就達不到這麼多目的。問題基本出在價值觀應用中的不一致,邏輯不嚴謹。用虛偽的態度對待問題依然在同一個認知層次。
回復 rfw1972 2025-1-31 11:45
浮平: 這次並非因為高調,也沒有那麼多敵人,而是內行看門道的正常反應,客觀檢驗的反饋過程。你假想的」敵人「並沒有以猜疑和惡意動機為依據去拒絕和詆毀,依然按照規
俺說的是為人處事的常識,遵循這些道理就能讓自己處於不敗的位置。中國是美國的敵人是你爹說的,不是俺。
回復 浮平 2025-1-31 12:17
rfw1972: 俺說的是為人處事的常識,遵循這些道理就能讓自己處於不敗的位置。中國是美國的敵人是你爹說的,不是俺。
你說的話就是你的觀點,別人誰說了什麼你引用出來,不要渾水摸魚東扯西拉。找爹的思想說明自己尚未長大成人,粗俗籠統,信口開河。又喜歡管閑事,又沒有獨立思考的能力,說一句話就開始找爹。

你自己缺乏邏輯知識怎麼看得到邏輯層面的問題呢,當然需要告訴你。不然還到哪裡找爹教你呢。
回復 rfw1972 2025-1-31 12:53
浮平: 你說的話就是你的觀點,別人誰說了什麼你引用出來,不要渾水摸魚東扯西拉。找爹的思想說明自己尚未長大成人,粗糙籠統,信口開河。又喜歡管閑事,又沒有獨立思考
一個人應該老老實實做事,說實話,做實事,和自己比,就能不斷進步。事事和別人比,不是把自己氣死,就是得罪不該得罪的人。資治通鑒里有無數成功失敗的案例。
回復 浮平 2025-1-31 13:44
rfw1972: 一個人應該老老實實做事,說實話,做實事,和自己比,就能不斷進步。事事和別人比,不是把自己氣死,就是得罪不該得罪的人。資治通鑒里有無數成功失敗的案例。
光學舌抄般不夠,那屬於毛澤東對你的洗腦教育。長大了就只有吵架的程度。要學習邏輯知識和樹立個人一致的是非善惡價值判斷依據原則。
回復 rfw1972 2025-1-31 15:21
浮平: 光學舌抄般不夠,那屬於毛澤東對你的洗腦教育。長大了就只有吵架的程度。要學習邏輯知識和樹立個人一致的是非善惡價值判斷依據原則。
你的智商太低了
回復 jchip 2025-1-31 23:13
估計這場風暴過後,華爾街的金融公司,大小的軟體公司都要投入DeepSeek的懷抱
回復 jchip 2025-1-31 23:13
rfw1972: 你的智商太低了
女輪除了啰嗦沒其他
回復 Wuming123 2025-1-31 23:57
有個說法,知識是」贓物「!我認為如果知識私有化,就是拿贓物當成傳家寶!你寫一本書,有人看,說明人們給你面子,看得起你!如果靠賣書賺錢,就是貪天之功。因為書中絕大多數東西都不是作者發明的,都是抄來的!

這裡再懷念一次大俠Aaron Swartz,一個為了人類知識共享,而顯出自己生命的後生!正是因為他,我們現在才能自由的下載各種研究文獻。
回復 浮平 2025-2-1 03:45
jchip: 女輪除了啰嗦沒其他
最後一招就是把自己的流氓馬甲搬出來胡鬧。科大理工男不學好,專門搞下三濫。
回復 rfw1972 2025-2-1 18:33
浮平: 最後一招就是把自己的流氓馬甲搬出來胡鬧。科大理工男不學好,專門搞下三濫。
俺是理工男不錯,但不是科大的。這裡的人都知道我只有一個馬甲就是你。
回復 浮平 2025-2-2 01:14
rfw1972: 俺是理工男不錯,但不是科大的。這裡的人都知道我只有一個馬甲就是你。
理工男 IQ 高到了250.
回復 rfw1972 2025-2-2 01:28
浮平: 理工男 IQ 高到了250.
俺的250是正的,你的250是負的
回復 浮平 2025-2-2 01:29
rfw1972: 俺的250是正的,你的250是負的
價值觀分裂的人格和認知,正負都一回事。自己無法提升邏輯思維程度,靠專政洗腦 mess up 之後的僵化固執認知程度只能這樣,瞎鬧瞎混,lacking of self-reflection and critical thinking。

人文領域的邏輯知識,哲學思維,相當於在自然科學領域裡先建立 reference frame,不是以個人苦大仇深的情緒情感感覺為中心時刻亂變的坐標系。

facelist doodle 塗鴉板

您需要登錄后才可以評論 登錄 | 註冊

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-3-11 19:28

返回頂部