天天综合色天天综合色h,欧美一区亚洲一区,亚洲精品成人一区,在线不卡日本v二区707

網站地圖 - 關于我們
您的當前位置: 首頁 > 科技 正文

肯尼亞“喂養”GPT-4

作者:用戶投稿 時間:2023-04-04 09:30 點擊:
導讀:本文來自:時代周報APP,作者:劉沐軒,編輯:梁勵,頭圖來自:視覺中國積灰的吊扇慵懶地轉著,十幾個肯尼亞人盯著笨重的臺式電腦屏幕,不斷露出驚訝的神情。考慮到這里

肯尼亞“喂養”GPT-4

本文來自:時代周報APP,作者:劉沐軒,編輯:梁勵,頭圖來自:視覺中國

積灰的吊扇慵懶地轉著,十幾個肯尼亞人盯著笨重的臺式電腦屏幕,不斷露出驚訝的神情。

考慮到這里是肯尼亞內羅畢的基貝拉貧民窟,一個過半居民沒有工作,連自來水和干凈的廁所都難得一見的地方,可能有人會誤以為,他們一定是“村里剛通上網”,才會露出這種沒見過世面的反應吧?

與想象的不同,實際上,他們在為全球最先進、最熱門的AI產品ChatGPT工作。這些人被稱作數據標注師,正是他們保障了ChatGPT“健康成長”,使其成為一個彬彬有禮、夸夸其談的聊天AI。

近半個月以來,隨著ChatGPT最新版本GPT-4的發布,全球科技公司紛紛跟進,例如英偉達宣布在芯片硬件和云服務領域上全面支持AI的開發,百度發布文心一言,而AI也再次成為全球焦點。

但在光鮮亮麗的社會變革和投資熱潮背后,卻是一群時薪不到兩美元的肯尼亞人來教會AI,何為善惡。

而且這份工作,并不光鮮。

一、“精神污染”

互聯網上的言論總是充滿著“戾氣”,幾條惡毒的言論就可以影響一個人的心情。如果有這樣一份工作,要求員工每天高強度閱讀9個小時的惡意內容,時薪多少能讓人接受?

為OpenAI閱讀和標記這些內容的肯尼亞人,實得工資約為每小時1.32美元至2美元(約合9~13.7元人民幣)

這些肯尼亞數據標注師的工作內容類似于鑒黃師,但更重口。

為了教會ChatGPT什么內容不該學,數據標注公司Sama從暗網上找來了各種由人性最黑暗面產生的文本和圖片,包括但不限于無碼的血腥酷刑、反人類的犯罪現場、兒童性虐待和仇恨言論。

一位負責為OpenAI閱讀和標記惡意文本的肯尼亞數據標注師表示,他在閱讀了一則跨物種獵奇性行為的圖片后,反復出現幻覺。“那是一種折磨,即便是在一周后,我還是偶爾會想起那張圖片,止不住地犯惡心。”

用中文互聯網的流行語來形容,就是“我的腦子不干凈了”,或“辣眼睛”。

一張圖片的影響已如此之大,但除了圖片之外,肯尼亞的數據標注師們每天還需要閱讀150至250段文本,長度從大約100個單詞到1000多個單詞不等。

這些讓人心理和生理上不適的內容,不斷撕裂著數據標注師的三觀,每個人都積攢了大量的精神壓力。最終,沒人能堅持超過3個月。

因此,雇傭他們的Sama公司在2022年2月終止了為OpenAI提供服務的合同,比計劃提前了八個月。

Sama是一家總部位于美國舊金山的公司,長期在肯尼亞、烏干達和印度雇用員工,為谷歌、Meta和微軟等硅谷公司提供類似的數據標注業務。Sama將自己定位為一家“有道德的AI公司”,聲稱已幫助50000多人擺脫貧困。

自稱是改善社會生產方式的變革,但AI的源頭卻從這樣令人痛苦的工作開始。剝削貧困國家的廉價勞動力去做最基礎的工作,是否會成為AI誕生的“原罪”?

二、離不開人的AI

即便是最先進的AI,也仍然離不開人,哪怕這個人來自相對貧困落后的國家。因此,肯尼亞數據標注師們的工作對OpenAI而言至關重要。

事實上,ChatGPT的前身GPT-3,就已經具備了令人印象深刻的語言表達能力和邏輯認知能力。但由于缺乏對于互聯網信息的篩選機制,GPT-3也會被充滿惡意的信息誘導,輸出一些仇恨、暴力、歧視的內容。

在全面推廣后,一旦發生類似“AI支持納粹”這樣的公關危機,整個行業都有可能被偏見推上風口浪尖,導致技術進步停滯。

如今,大多數的互聯網平臺都有著運用AI技術的信息審核機制,從最基礎的關鍵詞初篩,到高級的識圖和從語言邏輯中判斷惡意內容,都離不開AI技術的身影。

想要構建這樣能夠自我學習和進化的信息審核機制,OpenAI借鑒了Facebook等社交媒體的做法。那便是先收集那些帶有血腥、暴力、仇恨言論和性虐待標簽的素材,由遠在肯尼亞的數據標注師進行人工評級打分,再教給ChatGPT。

經歷多輪人工校對后,ChatGPT將建立自己的“善惡觀”,在產生惡意言論之前,就將其過濾掉。

現在呈現在世界面前的,這個禮貌、成熟,甚至表現出一定共情能力的GPT-4,可以說是AI見慣了人間百態之后的樣子。

OpenAI“誕下”了GPT-4,但雇了一批肯尼亞“保姆”,干著最臟最累的活來“養育”GPT-4。

“ChatGPT和其他語言模型AI令人印象深刻,但他們并不神奇。”人工智能倫理學家安德魯·斯特雷特表示,因為這些AI仍然依賴于大量人力和數據,其中大部分是未經授權和未經同意使用的,連這個領域最明星的企業OpenAI也沒能解決這些嚴重的基礎性問題。

三、為什么是肯尼亞?

對于外界而言,崎嶇的山脈、茂密的森林和野生動物豐富的大草原,構成了他們眼中的肯尼亞。

然而在這片不到60萬平方公里的國土上,生活著5300萬肯尼亞人,其中不少人選擇了從事與計算機相關的數字工作。

據2021年肯尼亞媒體《肯尼亞華爾街》的一份報告,肯尼亞成年人口中有超過120萬數字工作者。相比于2019年的63.8萬人,這一數據有了顯著增長。

肯尼亞“喂養”GPT-4

肯尼亞的數字工作者數量逐年增長。(圖源:肯尼亞華爾街)

他們從事線上營銷、線上助理、學術寫作、軟件開發和數據科學等工作。

根據市場分析機構埃森哲的預測,到2025年,數字經濟預計將占肯尼亞GDP的9.24%。但這一數字仍遠低于世界銀行統計的全球平均水平15%。

盡管肯尼亞的互聯網普及率不高,貧富差距極大,但還是有一部分人率先享受到了線上工作的便利。

政府對數字經濟的推動,極低的工資標準,以及勞動法執行的紕漏,促使肯尼亞成為發達國家的數字外包“工廠”。

就拿數據標注師的工資而言,雇傭美國人的平均月薪約為4374美元(約合3萬元人民幣),雇傭印度人的平均月薪要1.67萬盧比(約合1400元人民幣),而雇傭肯尼亞人僅需每月2萬肯尼亞先令(折合約1044元人民幣)

美國《時代周刊》曾采訪多名承擔ChatGPT外包數據標注師的肯尼亞Sama員工,他們都表示并沒有收到公司承諾的“全身心保障”福利,比如心理咨詢、冥想、護理和游戲等。

但對于工資,他們并未表達出明確的不滿,Sama承諾的每月21000~40000肯尼亞先令的工資水平,已經遠遠高于當地最低月薪標準15000先令。為了生計,他們也都不愿透露姓名。

遭受“精神污染”的數據標記師終究還是少數,大多數肯尼亞數據標記師處理著相對正常的內容。對于討生活的肯尼亞人而言,與其考慮自己是否“被剝削”,還不如接受這份高薪的外包工作。

這也促使科技巨頭們打著“幫助當地發展人工智能”的口號,變本加厲地在這些國家攫取廉價勞動力資源。

或許在他們看來,一個工業結構不完整,政局不穩定的貧困非洲國家,僅憑一群學歷都不高的員工幫助國際科技巨頭們做點外包工作,怎么可能實現所謂“人工智能領域的彎道超車”呢?

本文來自:時代周報APP,作者:劉沐軒,編輯:梁勵

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系hezuo@huxiu.com

如對本稿件有異議或投訴,請聯系tougao@huxiu.com

End

想漲知識 關注虎嗅視頻號!

打賞

取消

感謝您的支持,我會繼續努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類
Copyright ? 2021 早報網 版權所有
蘇ICP備2024138443號

蘇公網安備32130202081338號

本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯系客服 106291126@qq.com 對其相關內容進行刪除。
早報網登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
《早報網》官方網站:www.m.mfzxfx.com互聯網違法和不良信息舉報中心
Top 主站蜘蛛池模板: SHOW| 陇西县| 栖霞市| 永泰县| 金湖县| 屯昌县| 贺州市| 平乡县| 漳浦县| 阿合奇县| 怀远县| 沙湾县| 七台河市| 建阳市| 井研县| 盐源县| 香港 | 乌什县| 马尔康县| 公安县| 吐鲁番市| 望奎县| 合山市| 阿克苏市| 元江| 仪征市| 福安市| 浙江省| 兴业县| 榕江县| 华亭县| 东阳市| 通榆县| 怀仁县| 安远县| 文安县| 丰县| 旬阳县| 桐庐县| 桓台县| 中西区|