Gemini修改bug讓網友大開眼界:錄網頁影片把程式碼庫甩給它就好
X一小夥分享,為測試Gemini 1.5 Pro,自己在編寫一個網頁的程式碼時故意留了3個bug,並分別錄製了網頁bug影片。接著把程式碼庫打包成檔案連同影片一起輸給了Gemini 1.5 Pro,提示它找到並修復程式碼中的所有bug,且要提供一個簡要指南以及所做更改的說明。
沒想到,Gemini 1.5 Pro還真就分分鐘正確辨識並修復了每個bug。
小夥將這種玩法po出來後熱度不斷攀升,網友們紛紛一鍵三連,轉讚收藏量過萬。
其本人也在評論區強調,“這只是一個簡單的例子,也將是它最差的表現”,Gemini這小汁前途不可限量啊。
有網友表示想起來一件事覺得有趣:英偉達黃院士前段時間曾公開表示“孩子們以後不需要學編程了”,那時候還有很多人反對稱“AI不會取代程式設計師”
。
但甭管怎麼說,AI可以給程式設計師幫忙是有目共睹的。
接下來我們展開來看Gemini 1.5 Pro修復bug的經過。
事件經過
如同開頭所提到的,網友先是在寫網頁程式碼時故意寫錯了3處:
這就導致網頁上的一些功能操作無法正常運行,於是小伙分別拍攝了3處無法正常運行的視頻,每個視頻十幾秒鐘。
然後將影片連同程式碼庫一起輸給了Gemini 1.5 Pro。
prompt為:
Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修復我程式碼中的bug,為我創建一個簡單的Markdown指南以修復bug,然後編寫實際的程式碼來修復。我需要完整的程式碼,就像它是為了一個完整的Pull Request一樣,這樣我才能進行更改。)
隨後,Gemini 1.5 Pro立刻準確辨識了3個bug:
點擊待辦事項並不會將其標記為完成/未完成
主題切換器不會切換主題
點擊登入按鈕不會觸發任何操作
緊接著就分別給出了修復方案,附帶代碼:
小夥仔細控制自己敲的代碼,確認Gemini 1.5 Pro給的答案是正確的:
小夥也強調,這3個bug在程式庫檔案中其實離著很遠,這也意味著Gemini 1.5 Pro確實讀完了完整的上下文。
“想要存取權限”
網友看到這一系列操作後激動搓手,直呼想要Gemini 1.5 Pro訪問權限:
除坐等外,還有網友表示用GPT-4幫忙修復代碼也很好使,順帶暢想了一下GPT-5:
接下來可能是即時互動?或許能與GPT-5進行螢幕分享?
而另一邊已經取得存取權限的網友早就玩嗨了。
例如,一次輸給Gemini 1.5 Pro最新的10篇論文,讓它從中找到一個作者的電子郵件地址。
結果Gemini 1.5 Pro第一次就成功找到了:
然後又讓Gemini 1.5 Pro從超360000token的《哈利波特與鳳凰社》整本書中找到一句話的說話人,Gemini 1.5 Pro也成功找到了。
測驗繼續上難度,一次輸入三本書,Gemini 1.5 Pro最後用時約1分鐘再次成功找到對應的說話者:
驚訝之餘,這位測驗者總結了Gemini 1.5 Pro的邏輯推理能力:
對於常規提示,接近GPT-4的效能。
但當我加入數十個例子時,Gemini的效能正在提升,似乎沒有上限。多範例提示成為了新的微調方法。
華頓商學院教授Ethan Mollick也來整活了。輸給Gemini 1.5 Pro一本352頁的《太空60年》規則手冊,約250000token,然後要求它扮演一個角色。
即使說明書分散在很多頁上,而且非常複雜,但Gemini「似乎明白了」:
Ethan Mollick教授表示,對所有其他AI進行這項測試都是失敗的,只有Gemini 1.5 Pro成功了。
這位網友想要編譯整個X演算法的程式碼儲存庫並將其上傳到Gemini 1.5 Pro,正在線向網友徵集想問的問題。
只見編譯完成後,共310489token,Dogan Ural向Gemini 1.5 Pro提出了網友們關心的一系列問題,例如“在Twitter上擴大或者減少影響力的前5件事是什麼?”
Gemini 1.5 Pro很輕鬆地給了這樣嬸兒的答案:
你還看過哪些有趣的玩法?歡迎評論區分享~