隨著AI技術快速發展,Anthropic最新推出的Claude 3.5版本,特別針對電腦操作、程式碼撰寫和工具使用進行了全面強化,讓使用者能更有效率地處理複雜工作。這次更新涵蓋了兩個版本:專注於平衡智力和速度的Claude 3.5 Sonnet,以及反應更迅速的Claude 3.5 Haiku。這篇文章將詳細介紹兩者的新功能和應用場景,幫助使用者快速掌握AI的最新技術,提升工作效率,實現自動化流程。
一、Claude 3.5更新總覽
Claude 3.5這次的更新重點在於進一步提升模型的電腦操作能力,並強化程式碼撰寫與工具運用功能,針對現代工作環境中需要頻繁操作電腦的需求提供更便捷的解決方案。本次推出的兩個版本分別是Claude 3.5 Sonnet和Claude 3.5 Haiku,兩者在不同情境下各有優勢,針對性地解決使用者在電腦操作、程式設計及即時回應上的痛點。
二、電腦操作新功能:更直覺的AI助手
這次更新中,Claude 3.5 Sonnet的電腦操作功能備受關注,Anthropic首次開放此功能進行測試,讓AI能夠自動化執行例如表格填寫、檢查試算表、打開應用程式等複雜任務。為了實現這項功能,Anthropic開發了一個全新API,讓Claude可以「感知」電腦介面並與之互動,執行如移動游標、點擊開啟瀏覽器等操作。這使得開發者可以利用Claude來自動化重複流程,如填表和文件查找,大幅減少手動操作的時間,並提高工作效率。
根據OSWorld標準測試結果,Claude 3.5 Sonnet在理解螢幕截圖上取得了14.9%的得分,超過第二名Cradle BAAI的7.8%以及OpenAI GPT-4 Vision的7.7%。雖然這一數據仍未達到人類水準(約70%),但這顯示了AI在操作電腦能力上的顯著進步。
三、程式撰寫和工具使用的進步
Claude 3.5 Sonnet在程式撰寫和工具運用上表現亮眼,這對於需要頻繁進行程式碼撰寫的開發者和工程師來說非常實用。在多項評測中(如HummaEval和SWE-bench Verified),Claude 3.5 Sonnet的得分分別達到93.7%和49%,遠超前一版本的88.1%和40.6%,代表其在程式碼撰寫的準確性與效率上取得了大幅度提升。
Replit等線上程式開發平臺也已採用Claude 3.5 Sonnet進行自動化應用程式建置及測試。這次更新讓開發人員在應用程式開發過程中,可以更方便地利用AI進行效能檢查及問題排查,進一步縮短開發週期。
四、Claude 3.5 Haiku:針對即時回應的低延遲模型
除了Sonnet以外,Claude 3.5 Haiku則是針對需要即時回應的應用場景所開發的低延遲模型,適合用於高效處理即時需求的服務,如客戶支援、即時產品推薦等。Haiku在HummaEval的程式撰寫測試中得分88.1%,在解決實際軟體問題的SWE-bench Verified測試中也有40.6%的成績。
此外,Claude 3.5 Haiku還具備更強的指令遵循能力與工具使用準確性,適合於開發面向使用者的應用服務,如根據購買歷史生成客製化推薦、庫存管理系統,或者針對特殊客戶群體提供精準回應的代理任務。
五、AI應用的未來:解鎖大量自動化機會
Anthropic表示,未來隨著AI電腦操作能力的成熟,許多現代化的工作流程可以進一步自動化,特別是在需要高效處理複雜資料或執行多步驟流程的領域。這將為企業和個人帶來更強的自動化能力,減少手動操作的重複工作量,並降低出錯率。
TAU-bench測試顯示Claude 3.5 Sonnet在真實應用場景中的表現顯著增強,尤其在零售與航空等多步驟任務中分別取得了69.2%與46%的成績,較前一版本提升了不少,這說明Claude能更好地應對多步驟且複雜的任務。隨著這類功能的應用擴展,AI有望在許多需要複雜邏輯推理的場景中實現高效應用。
六、如何存取Claude 3.5
目前Claude 3.5 Sonnet和Haiku都可以通過API、Amazon Bedrock以及Google Cloud的Vertex AI進行存取,但Claude 3.5 Haiku初期僅支援文字輸入,圖像輸入功能將在後續更新中加入。這樣的多重存取方式方便企業和開發人員選擇適合的方式來導入AI模型,並結合自身業務需求來提升工作效率。
Claude 3.5的應用前景與挑戰
總結來說,Claude 3.5的更新為現代化工作場景帶來了顯著的進步,從電腦操作到程式撰寫,無論是應用於自動化流程或即時客製化需求,Claude都展現出高度的潛力。雖然在部分人類操作上仍有進步空間,但在不斷優化的過程中,Claude系列模型將繼續推動AI技術在實際應用中的落地,為更多產業提供創新解決方案。
➤ 歡迎在104學習精靈關注【AI趨勢報-科技愛好者的產地】獲得更多科技新知!