ChatGPT之父最新專訪:發現GPT-4o驚喜用途下一代模型可能不是GPT-5
GPT-4o 的發布又一次驚艷了全世界,而Ilya 的辭職也引起了熱議,甚至是被視為一個時代的結束。就在Ilya 辭職之前,有著「ChatGPT 之父」稱號的OpenAI 的聯合創始人兼首席執行官Sam Altman 接受了專訪。
訪談中,Sam 從GPT-4o 的使用體驗,到GPT-5 出現的時機與新形式,以及AI 為企業和個人帶來的機會,為我們揭示了不少發布會的幕後細節,對人工智能助理的前景表達了自己的興奮和憂慮。
以下是採訪全文:
GPT-4o 讓我愛不釋手
Logan:歡迎來到《Logan Show》,這是一檔與科技領域領導者與投資人對談的節目。本期你將聽到我與OpenAI 的共同創辦人兼執行長Sam Altman 的對話。
我們將會深入探討與近期非常熱門的人工智慧相關的多個主題,以及OpenAI 的發展方向,還有Sam 對於AI 這個前沿領域的看法。
Logan:好的,讓我們從輕鬆的問題開始。在執掌OpenAI 的過去四、五年間,你生活中最大的改變是什麼?有沒有什麼不尋常的改變呢?
Sam:發生了很多,其中最奇怪的就是我無法再在公共場合當個「小透明」。如果之前聽到這種話,我可能只會覺得“好吧,是有點奇怪”,實際上它比想像中更奇怪,這是一種很奇特的孤立的生活狀態。
Logan:你曾經非常堅信人工智慧和商業的力量,那麼你難道沒有想過執掌這樣一家公司可能帶來的連鎖反應嗎?
Sam:我沒想到很多事情,例如公司會成為一個非常有影響力的公司,更沒想到光是在自己的城市出去吃晚餐都會變得如此困難,這真的很奇怪。
Logan:不久前,你剛發布了多模態模型GPT-4o。它可以跨越文字、語音和視覺工作,你能解釋一下多模態的突破為什麼很重要嗎?
Sam:因為我認為多模態的方式是使用電腦的一種革命性的飛躍。實際上,我們很久以前就有了語音控制計算機的想法。你知道的,我們有Siri,之前還有其他類似的技術,但它們從來沒有讓我感覺到使用起來很自然。
但GPT-4o 這個技術,由於多面向因素的結合——它的功能、速度、增加的多模態支援、語調的自然性等——讓使用體驗大大提升。你可以輕鬆地調整說話速度或改變聲音,它的流暢性和靈活性讓我非常喜歡。
Logan: Spike jonze(電影《Her》的導演)會對它感興趣哈哈。有沒有什麼特定的使用場景吸引了你?
Sam:嗯,雖然我才用了一週左右,但有個特別驚喜的用途是:在我全神貫注工作時,將手機放在桌上。然後在不需要切換視窗或停下我的工作,就能夠將GPT-4o 作為一個新的資訊管道。這樣我就不需要打斷我的工作流程,就可以詢問它並得到答案,這很不錯。
Logan:那麼,這一切的背後是架構上的改變還是更多的算力?
Sam:其實這就是我們在過去幾年間在研究中的積累,我們一直在研究音頻模型,我們一直在研究視覺模型,我們也一直在嘗試把它們結合起來,我們還一直在尋找更有效率地訓練模型的方法。這並不是說我們發現了某個革命性的新技術,而是所有這些的結合。一次性把所有技術拼湊在一起確實不簡單。
Logan:考慮到延遲的問題,你覺得是否需要開發在設備上運行的模型,以減少延遲,達到實用性所需的水平?
Sam:對於影片來說,處理網路延遲可能會成為一個難題。我一直對AR 眼鏡這種能即時與世界交流、感知事物變化的東西情有獨鍾,但網路延遲可能會讓這變得很困難。不過,兩到三百毫秒的延遲,人會感覺非常快,在很多情況下這個延遲比人類的反應速度更快。
Logan:好的,你最近提到了下一次的大型發布活動可能不會是ChatGPT 5。似乎有一種迭代式的模型開發方法正在被你們採用。我們可以這樣理解嗎?
Sam:未來發布的大模型可能不會是一個標誌性的大版本,如GPT-5,我確信我了解到的一點是,AI 和驚喜不是很搭。雖然,你知道科技公司通常遵循發布產品的傳統方式,但我們可能應該採取不同的策略。
現在,我們仍然可以稱它為ChatGPT 5,並以不同的方式發布,或者我們可以考慮其他名稱,但我認為我們仍在摸索如何為這些東西命名和定位。我覺得以GPT-1 到GPT-4 這樣的命名是合理的,但現在很明顯GPT-4 已經有了很大進展。
我們也有這樣的設想,可能會有一種潛在的像是「虛擬大腦」一樣的基礎模型,在某些情況下,它可能比其他情況進行更深入的思考,或者可能是探索不同的模式,但用戶也許不在意它們是否有差異,我認為我們還不知道如何讓這些產品在市場上受到青睞。
Logan:這是否意味著,計算在模型上取得漸進式進展的需求可能比以往少?
Sam:我更傾向於認為,我們會盡可能地利用我們所能獲得的所有運算資源。我們現在正在取得難以置信的效率提升,這非常重要。
你知道,今天我們發布的一個很酷的功能顯然是語音模式,但或許最重要的是我們做到瞭如此高效,以至於我們能夠向免費用戶提供服務,達到世界頂尖的水準。
任何想免費下載ChatGPT 的人都可以得到它,而且它相對於GP4 和GP4 Turbo 在某些場景有了顯著的效率提升。我們在這方面還有很多進步的空間。
當我們從幾十年後回望,會說:“某些事情改變了”
Logan:我聽說你提到ChatGPT 實際上並沒有真正改變世界,但可能只是改變了人們對世界的期望。
Sam:是的,我不認為你可以從任何經濟指標中找到太多證據表明ChatGPT 真的影響了生產力或其他領域,或許客戶支援或某些特定領域是例外。但如果你查看全球GDP,你能發現ChatGPT 發布的影響嗎?恐怕不行。
Logan:會不會存在一個我們可以明確地看到GDP 成長的時間節點?
Sam:我不確定是否能夠說這是因為某一個模型的影響,但我認為如果我們從幾十年後回望,會說:“嗯,某件事情改變了。”
Logan:在接下來的12 個月裡,我認為哪些應用或領域最有前景?
Sam:我可能會因為所在領域的限制,存有一些偏頗,但我認為程式設計是一個非常重要的領域。
Logan:關於“慘痛教訓”,你最近也花了一些時間進行討論。你曾詳細討論了深度專業化模型與通用模型的主要區別在於,專業化模型是為了特定的數據和目的訓練的,而通用模型則具備真正的推理能力。
Sam:我相信,未來真正有影響力的將是通用模型。如果一個能進行通用推理的模型發現新事物,那麼當需要處理新類型的數據時,我們只需提供新的數據,它就能夠適應並處理。但專業化模式在這方面是不可能的。
我認為許多專業化模型組合在一起,也無法進行通用推理。所以,編寫特定模型的重點可能在於,我認為我們最應該弄清楚的是真正的推理能力,然後我們可以將其應用於各種場景。
自然語言是人和AI 之間很好的溝通方式
Logan:你認為未來兩年內人類與AI 之間的主要溝通方式會是什麼?
Sam:自然語言似乎是個很好的選擇。我對這個想法很感興趣,那就是我們應該設計一個人類和AI 可以共同使用的未來機制。我對類人機器人比其他類型的機器人更感興趣,因為我覺得現在的世界是為人類設計的,我不想讓它為了某種更有效率的模式而重新設計。
我喜歡這樣一個想法,即我們用非常適合人類的語言與AI 交流,它們甚至可以用這種方式相互交流,這個想法可能還有待探索。儘管無法預知未來,但我認為這是一個值得推動的有趣方向。
Logan:你最近提到,隨著時間的推移,模型可能會變得越來越走向大眾,但最重要的可能會是關於模型的個人化,我理解你的意思了嗎?
Sam:我不是很確定,但我覺得這聽起來很有道理。
Logan:那麼,除了個人化,你認為最終對使用者而言,普通的商業使用者介面和易用性最終會成為勝出的關鍵嗎?
Sam:這些因素當然很重要,它們總是如此。我可以想像還有其他因素,但我認為,常規的商業規則仍然適用。
每當出現新技術時,我們總是很容易認為舊規則不再適用,但這種想法通常是錯誤的,傳統的創造和流失價值的方式如今仍然很重要。
Logan:當你看到開源模型開始追上基準標準的時候,你怎麼想?
Sam:我覺得這非常好。我認為,就像其他技術一樣,開源將有其一席之地,託管模型也是如此,這很好。我不會詢問任何具體的細節,但已經有媒體報導籌集大量資金的消息。華爾街日報是其中一個可信的報道來源,這些資金是為了在半導體產業激勵投資。像台積電和NVIDIA 這樣的公司一直在積極擴張,以滿足對AI 基礎設施的期望。
Logan:你最近說過你認為世界需要遠超過目前水準的更多AI 基礎設施。那麼,你是不是觀察到需求端有些什麼需要比我們目前從台積電和NVIDIA 獲得的更多的AI 基礎設施?
Sam:所以首先,我有信心我們會找到方法降低現有系統的成本。其次,隨著成本的降低,人工智慧系統的需求必然激增。我相信,打造更大更強的系統,需求將會進一步飆升。
我們都應該期待一個智慧資源便宜到不需計價的世界,在那裡,智慧資源豐富到人們可以隨意使用,甚至不用考慮太多。比如說,我是希望它幫我閱讀回覆所有郵件,還是用來治療癌症?當然,治癒癌症更重要,但理想情況是兩者都能實現。我關注的是確保我們擁有足夠的資源,讓每個人都能享受智慧科技帶來的益處。
Logan:我想請教你對於Humane、Limitless等公司推出的不同實體設備助理有何看法?你認為它們有哪些不足之處,或為何它們的普及程度尚未達到預期的使用者需求?
Sam:我認為它們都太早期了。我一直是多種計算設備的早期用戶,有著豐富的使用體驗。我曾經擁有並非常喜歡Compaq TC1000,覺得它超酷,那是我大學新生時期的事了,它與iPad 相比還有很長的路要走,但方向是對的。
後來我又用了Treo,我用的是老款的Palm Treo,那時孩子們並不會擁有它,而它與iPhone 相比也有很長的距離。但最終我們還是實現了。這些設備似乎朝著一個非常有前景的方向發展,只是還需要一些時間的打磨和技術的迭代。
適應AI 進步:建立有長期競爭力的企業
Logan:你最近提到,許多在GPT-4 上建構的業務在未來將會被更先進的GPT 技術「碾壓(steamrolled)」。能詳細解釋一下這個觀點嗎?談到AI 領域的企業特點,哪些企業能在GPT 的不斷進步中存活下來?
Sam:我發現的有效方法是,在建立業務時,你其實是在做兩種選擇:要麼賭下一代模型不會太出色,要麼就是賭模型會更進一步,並從中受益。
舉個例子,如果你投入大量努力,只是為了讓某個應用案例勉強可以運作,這個應用案例恰好是GPT-4 所不能處理的。然後當你終於成功時,但後來GPT-5 出現了,並且它能夠更出色地完成這個任務以及其他任務,那麼你之前為那個單一案例所做的努力可能就會感到有些尷尬了。
但如果你有一個產品,在各個方面都表現得還不錯,人們自然會去使用它,而你並沒有投入大量精力去實現某個特定功能,然後GPT-5 或者其他名稱的模型出現了,表現得更好,你就會享受到「水漲船高(the rising tide lift at all your boats effect.)」的影響。
我想說的是,大多數情況下你不是在創建一個AI 企業,而是在創建一個業務,AI 只是你採用的一種技術。在應用程式商店的早期階段,有許多產品填補了某些明顯的空缺,但隨後蘋果解決了這個問題,我們現在不再關注應用程式商店裡的手電筒應用,因為它們的功能已被整合到作業系統中。這將是未來人工智慧業務可能的發展方向。
然後有些應用,例如Uber,它們雖然是由智慧型手機的普及帶動的,但實際上它建立了一個非常穩固且長期可行的業務模式,我認為這正是我們應該追求的方向。
Logan:我明白你的意思,而且我能想像很多應用你們技術理念的企業,它們在某種程度上都符合這個框架。那麼,你能否給出一個具體的例子或新型概念,它符合我們之前討論的模式?例如,Uber這樣的公司,它不必是一個真實存在的企業,即使是一個假設性的公司、一個玩具概念,或者只是你認為以這種方式實現的某個想法也可以。
Sam:我更傾向於押注那些新興的新創企業,一個典型例子是,當人們嘗試創建類似於人工智慧醫生的人工智慧診斷工具,人們常說,「我不想在這個領域創業,因為像梅奧診所(Mayo Clinic)等知名機構肯定會做這件事”,但我更傾向於認為會有新公司湧現出來做這樣的事情。
Logan:對於那些想要主動準備迎接這些巨大變革的CEO,你有何建議?
Sam:我敢打賭,智能作為一種服務,每年都在變得越來越好、越來越便宜,這是取得勝利的必要條件,但並不足以讓你取勝。大公司雖然需要時間來做到這一點,你可以藉此優勢超越它們,但同樣意識到這一點的其他新創公司也會這麼做。
所以你需要搞清楚讓你的業務長期保持競爭力的策略。現在的競爭環境比往常都要開放,有許多令人興奮的新事物等著去做,但這並不意味著你可以忽視打造核心價值這一艱苦的過程,儘管現在有更多種方式可以實現。
Logan:鑑於人工智慧的快速發展,你能否預測在未來五年內可能湧現或成為主流的新職位類型?這些職位可能是目前鮮為人知或尚未存在的。
Sam:這是一個很棒的問題,我以前從未被問過。人們總是問,什麼工作會消失,但提問新工作更有趣。讓我想可能有1億或5千萬人可能會涉足的新領域。這可能涉及全新的藝術形式、娛樂方式,以及更重視人與人之間的連結。
雖然我不知道這些職位的具體名稱,也無法確定我們是否能在五年內達到這樣的規模,但我認為面對面的體驗將會變得非常珍貴,可能會形成一個新興的巨大市場。
我們可能會見證斷崖式的科技飛躍
Logan: OpenAI 最新的公開融資估值約為900 億美元。除了AGI,你認為還有哪些里程碑能讓OpenAI 成為一個萬億美元的公司?
Sam:我相信如果我們能持續以目前的速度改善技術,並且持續開發出好產品,收入也會繼續成長。我不確定具體的數字,但我認為我們的前景是光明的。
至於目前的商業獲利模式是否能創造1 兆美元的股權價值,訂閱模式對我們來說很有效。雖然我原本對此並不抱太大期望,但結果卻相當不錯。
Logan:至於OpenAI 目前的結構,雖然不想老調重彈,但你提到了途中的一些改變,你認為未來更適當的結構是什麼?
Sam:我認為我們已經準備好了討論這個問題,我們一直在積極探討和腦力激盪。我希望在今年內,我們能夠就此進行更深入的交流。
Logan:嗯,一個有趣的點是,關於人工智慧的既定印象,有一個特別有趣的話題是你的貨幣化模型觀點。我們曾聽你提及,首先是取代體力勞動,然後是白領工作,最後是創意工作。
但顯然,事情與預期完全相反。是否有其他出乎意料之外的事情呢?例如,我以為會是這樣,但實際上卻是完全相反的情況。
Sam:這對我來說確實是個巨大的意外。除了你提到的那一點,還有其他一些事情,例如我沒想到人工智慧會如此擅長法律工作,並且會這麼早就展現出這樣的能力。因為我一直認為法律工作是非常精確且複雜的。
Logan:對於那些還沒聽過你講過AGI,以及為什麼不喜歡這個術語,你能詳細解釋一下你的觀點嗎?
Sam:因為我知道AGI不再是明確的時間點。顯然,當你創辦一家公司時,你會有很多天真的想法,特別是在這樣一個快速發展的領域。 OpenAI成立之初,我也天真地認為,我們將從沒有AGI的時代開始,然後實現AGI,這將是一個真正的飛躍。
我仍然認為可能會有一些突然出現的飛躍式發展,但總的來說,我認為它還是會像一個持續增長的曲線一樣呈現波動上升的趨勢,關鍵是進步的速度。你和我可能不會在具體的月份或年份上達成一致,到那時我們會說好吧,現在這就是通用人工智慧了。我們可以設計其他測試,我們或許會對此達成共識,但即使這樣,事情比表面上看起來困難得多。
你知道,目前的GPT-4 顯然還沒達到普遍意義上的AGI水平,我也不覺得我們下一個大型模型會達到。但我可以想像,我們可能只差一兩個創新的想法,再加上一些規模擴展,就能創造出一些讓我們覺得真的不一樣的東西。我認為,對此保持警覺是很重要的。
Logan:是否有更現代的類似圖靈測試,我們可以稱之為巴特利特測試?
Sam:當它達到某個閾值時,我認為,如果它能夠進行比所有OpenAI 研究人員甚至是一個OpenAI 研究人員更優秀的研究,那將是一個非常重要的標誌。但這樣的進展是否即將到來,目前還不太確定,但我不會完全排除這種可能性。
Logan:你認為達成AGI 的最大的挑戰是什麼?聽起來你認為目前的規模原則可能還行得通,至少在接下來幾年內是如此。
Sam:是的,我認為最大的障礙是需要新的研究。你知道,我從網路軟體轉向AI 的過程中不得不學到,研究並不像工程那樣有固定的進度表。這通常意味著它需要更長的時間,並且不總是有效,但有時它的進展速度卻遠超任何人的預期。
Logan:能不能詳細解釋一下,為什麼它的進展不是線性的呢?
Sam:我想,透過歷史例子來解釋可能是最好的方式。
嗯,我記得中子最初是在20 世紀初被理論化,大概在20 年代首次被探測到,關於原子彈的研究始於30 年代,並在40 年代取得了成果。
從幾乎沒有任何關於種子的理論概念,到能夠製造出原子彈,甚至徹底動搖我們對物理學的直覺,這樣的速度簡直令人震驚。
還有一些不那麼純粹屬於科學的例子,例如關於萊特兄弟曾在1906 年他們認為人類飛行還要50 年,然後在1908 年他們就實現了飛行,類似的例子在科學和工程領域比比皆是。
當然,也有很多我們預測的事情從未發生,或者比我們預期的要花費數十甚至數百年的時間更久。但有時候,進步確實是突飛猛進。
Logan:關於可解釋性,我們目前在這一領域處於怎樣的位置?它對人工智慧的長期發展有多關鍵?
Sam:可解釋性有不同的層次,包括我是否理解網路在機械層面上的每一層運作方式,或者我是否能夠透過查看輸出來指出其中存在的邏輯錯誤。我對OpenAI以及其他機構在可解釋性方面的研究充滿期待。我認為,作為一個更廣泛的領域,可解釋性具有巨大的潛力和令人興奮的前景。
Logan:我不會催你,但我想你們在準備好要宣布什麼的時候,會有一個精彩的公告。這裡還有幾個問題,隨著人們對AGI的期待日益高漲,關於OpenAI等組織單方面利用其並做出決策的擔憂也在增加。這促使一些政府機構介入,希望由選舉產生的領導者來做出這些決策,而非完全依賴OpenAI等公司。
Sam:是的,我認為對於像我這樣的人來說,嚴格規範現有模型能力將是個錯誤。但當模型對世界構成重大的災難性風險時,我認為實行某種監督措施可能是件好事。
目前,如何設定這些風險的閾值以及如何有效測試它們,我們確實還仔細權衡。如果因為過度擔憂潛在風險而限制了這項技術的巨大優勢,讓那些希望在自家地下室訓練模型的人望而卻步,那將是一個巨大的損失。
但話說回來,如果我們用國際核武規則作為參照,我認為對人工智慧進行某種形式的監管是合理的。
Logan:嗯,你認為他們沒有看到人工智慧的潛在風險嗎?
Sam:我認為他們只是沒有整體上認真考慮過AGI。但我確實同情他們的立場,像是看看歐洲的科技產業發生了什麼,我理解,我真的理解。然而,我認為有一條我們正在接近的界限,超過這個界限,我們可能都會有不同的感受。
Logan:你認為開源模型本身就存在固有的危險嗎?
Sam:目前沒有哪個模型是這樣,但我可以想像將來可能會有。
Logan:我聽你說過,安全在某種程度上被當作了一種錯誤的框架,因為它更專注於我們明確接受什麼。
Sam:確實如此,這並不是一個非黑即白的事,就好比你願意坐飛機,因為你覺得它們相對安全,儘管你知道它們偶爾會出事。那麼關於什麼樣的航空公司才算安全,這個問題有許多討論,每個人的看法都不盡相同,這是個當前的熱門話題。
航空業已經變得極其安全,但安全並不意味著絕對沒有人在飛機上喪生。同樣,醫學領域我們也非常重視副作用,因為有些人會對藥物產生不良反應。此外,安全還有其隱性的一面,例如社群媒體可能帶來的負面影響。
Logan:你能想像在什麼情況下,你會在安全範疇上做出與推進相反的決策?
Sam:我們有一個叫做「準備框架」的東西,就是為了針對這些,也就是在特定的類別和層面上,我們的行動策略會有所不同,以應對潛在的風險和挑戰。
Logan:考慮到眾多快速湧現的應用場景,我認為我們目前面臨的一個主要瓶頸是人工智慧基礎設施的不足。假設有研究人員對現有的神經架構Transformer進行了某種突破性的改進,使得所需的數據量和硬體大幅減少,甚至接近人腦的水平,那麼你認為這是否會加速「技術飛躍」?
Sam:當然,這是有可能的,而且可能不需要任何修改。雖然我認為這不是最有可能發生的情況,但我並不完全排除這種可能性,重要的是,我們要在可能發生的各種情況中考慮這一點。
我認為,即使技術發展在加速,這個過程也會是漸進的。我不認為我們可能某天睡覺時還處在初步的人工智慧階段,然後隔天醒來就面對真正的超級智慧。但即使技術突飛猛進僅發生在一年或幾年之內,那也算是相當快速了。
另一個要考慮的是,即使我們擁有了真正強大的AGI,它在短期內對社會的影響也是有限的。我猜測,大多數情況下,它不會在一年或兩年內產生足夠大的影響,但在十年內,世界絕對會發生巨大的變化。在這方面,社會的慣性實際上可能是一個積極的因素。
多年後,人類仍會關心其他人類
Logan:嗯,你追求AGI的動機是什麼?撇開股權不談,即使我相信大多數人都會覺得,即使他們追求的是更高的使命,得到相應的報酬也會是一種安慰。那麼,你每天來工作的動力是什麼?你又從哪裡獲得最大的滿足感?
Sam:我一直對人們說,我現在願意做很多其他生活上的調整和犧牲,因為我認為這是我將會接觸到的最激動人心、最重要、最好的事情,這是一個充滿變革的時代,我很高興這不會永遠持續下去。
你知道,將來某天我可以退休去農場,我會懷念這段時光,但會想,哦,那些是壓力很大、非常漫長的日子。但這也是非常酷的,我簡直不敢相信這些事情真的發生在我身上,這就像是不可思議的奇蹟。
Logan:我們回到那個你因名氣而無法在自己城市出門的例子,是否有過一個最超現實的瞬間,那種讓你驚嘆:「哦,天哪」的瞬間?讓你感到彷彿置身於超現實的場景中?
Sam:每天都會有一些事情讓我驚嘆。例如那個星期(去年11月份被董事會罷免),我收到了來自世界上一些重要人物,如總統、國家總理等的10到20條短信,但這並不是讓我感到奇怪的部分。讓我感到真正奇怪的是,當這一切發生時,我像是在正常地回應他們,發送「謝謝」之類的訊息,感覺一切都非常自然。
我們度過了那四天半瘋狂而緊張的時光,我幾乎沒有睡覺,也沒有怎麼吃東西,但我的精神卻出奇地好,頭腦清晰,極度專注。
幾乎每天都有那麼一些事情,讓你驚嘆,如果我能稍微騰出一些心思去回想,這就會覺得太瘋狂了。有點像魚兒在水裡的感覺,但是,是的,就是那種效果。
Logan:所以,當你想到模型變得越來越智能,你之前稍微提到的那樣,關於創造性方面,在你看來,隨著人類和大模型開始承擔更多過去僅由人類完成的任務,哪些特質或能力仍將是人類所獨有的呢?
Sam:我相信,即使在很多年之後,人類仍然會關心其他人類。
我在網路上稍微搜了一下,大家都在說,“哦,現在大家都會愛上ChatGPT 了”,大家都會談論ChatGPT 女友什麼的。我敢打賭不會,我認為我們內心深處非常關心其他人,無論是大事小情,以各種不同的方式,這種對人的關心將會持續存在,我們對他人的關心幾乎可以說是一種固有的執著。
雖然你可能聽過許多關於人工智慧,但我想不必在意,畢竟我們不會把觀看機器人踢足球當作主要的娛樂愛好。
人和AI 助理的分離是有價值的
Logan:當你管理OpenAI 公司時,你在製定了很多經營企業的規則或框架,然後你同樣打破了許多規則。 OpenAI 是否引進了不同類型的主管?還是你是根據不同的特質來招募的?
Sam:我通常不傾向於從外部聘請高階主管,但我認為,如果公司總是只從內部提拔高階主管,可能會導致公司文化的單一化。我認為公司需要引進一些新的高階人才來注入活力。但在這裡,我們主要依賴本土人才,考慮到我們所做的事與其他地方的工作很不同,我認為這是一件好事。
Logan:在OpenAI 的發展過程中,有沒有一個決策在你做出的時候感覺特別重要?
Sam:很難只指出一個,或許有一個是:我們決定採用所謂的迭代部署策略,也就是我們不會秘密地構建AGI 然後一次性發佈到世界上,這是過去的普遍看法,這是當時許多公司和人們的普遍觀點和計劃。但我認為這個決定非常關鍵,而且在當時看來確實非常重要。
Logan:關於押注語言模型的背後故事我一直很好奇,這項決策是如何產生的?
Sam:嗯,當時我們團隊正專注於多個項目,包括機器人開發和視訊遊戲。然而,在這個多元化的背景下,一個相對較小但充滿熱情的團隊開始投身於語言建模的研究。伊利亞(Ilya Sutskever,OpenAI前首席科學家)對此方向深信不疑,他堅信語言模型的發展潛力,最終成了我們專注的語言模型。
於是,我們著手進行GPT-1 的開發,接著是GPT-2,我們深入研究了縮放定律,進而升級到了GPT-3,然後我們做出了重大決策,決定將作為我們的主攻方向。儘管事後看這些決策似乎顯而易見,但在當時,確實是經過深思熟慮的決策。
Logan:你最近提到了關於AI 的兩種不同方法:複製自己和打造最聰明的員工。
Sam:這不是關於AI 本身,而是關於你想如何使用AI,當你想像使用你的個人AI 時。
Logan:能否請你進一步詳細解釋?因為我認為這對你關於未來人工智慧用例的思考有深遠的影響,你能再次解釋那個觀點嗎?
Sam:當然。當我在未來五年內收到你的簡訊時,我希望能夠清楚地知道,這是你直接發給我的,還是由你的人工智慧助理代為轉發的。
我認為保持人和AI 助理的分離是有價值的,AI 助理也不能簡單地認為完全是人的延伸。對我來說,我不想感覺這個東西只是我身上的一個奇異附屬物,而是一個可以跨越障礙與我溝通的獨立實體。
你在音樂或創意領域就能看到這一點,複製德雷克或泰勒絲的音頻變得很容易,因為我們可能需要某種驗證機製或系統來確認,這確實是某個人的創意作品,個人層面大概也是。
當我們思考教育體系,想像一下2030 年或2035 年的大學新生,或未來的某個群體,大學教育體制中應該做出哪些具體改變來為未來做好準備,我認為最重要的一點是,學生不僅應該被允許使用,而且應該被要求使用。
在使用這些工具時,有時我們更傾向於讓人們採取傳統方式行事,因為這有助於加深理解。
我還記得在數學課上,有些時候你不能在考試中使用計算機。但實際上,在現實生活中,你是可以使用計算器的,因此你需要理解它的原理,並且要能熟練操作計算器。如果你在數學課上從來沒用過計算器,那你在以後的工作中會遇到困難。
如果OpenAI 的研究人員都不使用計算器,那麼OpenAI 可能至少在電腦方面不會取得如今的成就。我們不會教導人們不使用計算機或電腦,同樣,我認為我們也不應該訓練人們不使用AI。 AI 將成為未來從事有價值工作的重要組成部分。
Logan:最後,在規劃通用人工智慧(AGI)及其未來時,你曾寫道第一個AGI 只是智慧連續體上的一個節點,我們之前討論過這個主題。
Sam:我們認為,從那一點開始,進步可能會持續,未來很長一段時間內可能會保持過去十年的發展速度。
Logan:那你是否曾經私下停下來思考未來會是什麼樣子?還是它太過抽象,已經無法具體描繪了?
Sam:我一直在思考。但我不是說我能想像出有飛行汽車的《星際大戰》式未來城市場景,但我確實在思考,當一個人能夠完成數百上千個協作無間的人的工作時,這意味著什麼?當我們能夠探索到所有科學領域時,那會是什麼感覺?肯定非常酷。
Logan:是的。 Sam,感謝你接受這次訪談。