エピソード

  • Claude Tag 透過 Agent identity 實現 AI 獨立身分協作。 核心存取模型:Agent identity Claude Tag 改變了傳統 AI 僅能「代理使用者」的運作模式。在多人協作的頻道中,Claude 不再借用特定成員的憑證,而是被賦予獨立的「Agent identity」。這意味著: 獨立身分:Claude 在頻道中擁有專屬的 GitHub、Linear 或資料庫服務帳號,所有操作皆記錄在這些系統的日誌中,而非混雜在個人帳號下。 權限隔離:透過管理員設定,Claude 的存取權限被限制在特定頻道內。例如,工程頻道可存取程式庫與資料倉儲,而法律頻道則無法觸及這些資源,確保私密文件不會外洩。 統一稽核與撤銷:管理員僅需管理單一 Agent identity,若需終止存取,只需撤銷該身分,即可同步切斷其在所有關聯系統中的權限,大幅簡化管理負擔。 運作機制與場景區分 根據 Claude Tag 的設計,AI 的運作模式取決於互動場景: 私人對話(DMs):Claude 扮演「個人助理」,直接使用使用者的連接器(Connectors)與憑證,適合處理個人郵件、行事曆等專屬任務。 協作頻道(Channels):Claude 扮演「團隊成員」,使用由管理員預先配置的 Workspace service identity。這種模式支援長週期、自動化的任務,即使發起任務的使用者離線,Claude 仍能持續執行。 這段影片展示了一個整合多種工作服務的協作平台介面,透過自動化流程處理團隊任務。 管理與安全性配置 管理員可透過後台介面精細化管理 Claude 的能力: 存取套件(Access bundles):管理員可定義 baseline 權限,並針對特定頻道進行覆寫(Override)。 資源限制:可明確指定 Claude 能讀寫的儲存庫(Repository)、API 金鑰以及可載入的 skill 與 plugin。 安全邊界:Claude 的記憶(Memory)與存取權限嚴格限制在頻道邊界內,確保不同頻道間的資訊不會交叉污染。 這支影片介紹了如何透過 Claude Tag 設定 AI 代理的權限與協作功能。 未來展望 Anthropic 指出,隨著 AI 代理自主性提升,這種「多人協作」模式已成為必要。未來將進一步強化安全性,包括導入「即時憑證授權(Just-in-time credential grants)」,讓使用者能針對單一敏感操作進行即時審核,並開發「身分感知覆蓋層(Identity-aware overlay)」,在 Agent 的權限基礎上,額外疊加使用者層級的驗證,確保 Claude 僅在頻道權限與使用者權限雙重許可下執行任務。

    這段影片展示了一個整合多種工作服務的協作平台介面,透過自動化流程處理團隊任務。 影片中的 Prompt 與操作:

    操作步驟: 1. (00:00)顯示 #team-eng 頻道內的自動化任務執行摘要。 2. (00:04)畫面切換至顯示個人化連接器(Sam's connectors)的任務處理流程。 3. (00:09)畫面切換回 #team-eng 頻道視圖。

    這支影片介紹了如何透過 Claude Tag 設定 AI 代理的權限與協作功能。 影片中的 Prompt 與操作:

    Prompt(00:02): @Claude 建立一個測試 Linear 工單,內容為 Hello World

    原文:47: @Claude create a test linear ticket that says Hello World

    操作步驟: 1. @1:05 開啟 Claude Tag 管理介面 2. @1:25 點擊「Add access bundle」建立新綁定 3. @1:43 輸入綁定名稱「General Tooling」 4. @1:58 選擇 Linear 並輸入 API Key 5. @2:17 點擊「Test connection」測試連接 6. @2:28 將存取綁定附加至工作區 7. @2:55 建立第二個存取綁定「Data team」 8. @3:03 設定 Data Warehouse 的 GCP 存取權限 9. @3:34 將 Data team 綁定附加至特定頻道

    原文:https://easyvibecoding.app/curated/2190

  • Perplexity 推出 Computer for Counsel 自動化法律研究。 Perplexity Computer for Counsel 是一款專為法律專業人士設計的 AI 輔助工具,能自動化處理法律文件審閱、研究與監控任務。 核心功能與整合 Perplexity Computer for Counsel 專為法律專業人士打造,旨在將 AI 深度嵌入日常法律工作流。該工具能直接連結律師常用的研究資料庫與管理軟體,包括 Midpage AI、LegalZoom、DocuSign、NetDocuments、Box、Gmail、Slack、Microsoft Teams、Google Drive、Notion 及 SharePoint。透過這些整合,系統能自動化處理繁瑣的法律事務,例如合約審閱、紅線標記(Redline)以及商標事務追蹤。 法律研究與監控應用 使用者可透過對話介面下達指令,讓系統執行複雜的法律研究與監控任務。以「U.S. Data Privacy & AI Law Tracker」為例,系統能即時追蹤美國各州的隱私法與 AI 法規,並生成詳細報告。該儀表板目前監控的關鍵數據包括: 法案總數:200 項 狀態中法規數:20 項 待處理法案數:8 項 2026 年生效法規數:3 項 技術運作與責任歸屬 在執行任務時,系統會根據具體需求自動調用不同的大型語言模型(畫面顯示如 GPT-5.5、Claude Sonnet 4.6、Gemini 3.1 Pro)進行處理,並確保所有引用的來源皆可查證。儘管該工具能大幅減輕研究與草擬工作的負擔,Perplexity 強調,最終的法律判斷與決策仍須由專業律師負責。目前此功能已開放給所有 Pro 與 Max 訂閱者使用,詳細資訊可參考 Perplexity 法律應用案例頁面 。

    Perplexity Computer for Counsel 是一款專為法律專業人士設計的 AI 輔助工具,能自動化處理法律文件審閱、研究與監控任務。 影片中的 Prompt 與操作:

    Prompt(00:00): 為我的團隊製作一個美國各州隱私法與 AI 法規的追蹤器。 列出哪些州已頒布將於 2026 或 2027 年生效的新隱私法或 AI 法規,以及目前有哪些相關法案正在審議中。請包含科羅拉多州 AI 法案與加州 ADMT。請引用 Midpage 獲取相關法規與條例。每天早上發送電子郵件更新給我。使用 legal-research 技能。

    原文:09: Make my team a tracker for U.S. state privacy laws and AI regulations. Show which states have enacted new privacy or AI laws that go into effect in 2026 or 2027, and what bills on these topics are pending. Include the Colorado AI Act and California ADMT. Cite to Midpage for relevant statues and regulations on the books. Send me email updates every morning. Use legal-research skill.

    操作步驟: 1. @0:09 在輸入框輸入指令 2. @0:17 點擊送出按鈕 3. @0:21 系統自動路由至不同 AI 模型進行處理 4. @0:27 系統展示引用來源列表 5. @0:33 展示法規追蹤儀表板 6. @0:35 接收到系統自動發送的每日更新通知

    原文:https://easyvibecoding.app/curated/2187

  • エピソードを見逃しましたか?

    フィードを更新するにはここをクリックしてください。

  • Google核心研究員轉投Anthropic引發Gemini競爭力擔憂。 人才流動與產業影響 根據 Bloomberg 的報導,Google DeepMind 兩位關鍵成員 Jonas Adler 與 Alexander Pritzel 即將加入 Anthropic。這兩位研究員在內部被視為 Gemini 模型開發的核心貢獻者: Jonas Adler:曾負責 Google 的 AI 程式開發專案,具備應用數學背景,曾參與 AlphaFold、AlphaFold 3 及 Gemini 1.5 的開發。 Alexander Pritzel:自 2014 年加入 DeepMind 的資深成員,專精於深度強化學習(Deep RL)、不確定性估計與情節記憶(episodic memory),亦是 AlphaFold 2 與 3 的核心作者,後轉入 Gemini 訓練體系。 這是一張標示為 Jonas Adler 的個人簡介圖像,其職稱為 DeepMind 的研究科學家。 此次離職被視為 Google 近期人才流失潮的延續,此前已有諾貝爾獎得主 John Jumper 加入 Anthropic,以及知名研究員 Noam Shazeer 轉投 OpenAI。市場分析指出,這波離職潮反映了 Google 在面對 Anthropic 與 OpenAI 等新創公司競爭時的壓力,特別是在計算資源分配與組織優先級調整過程中,導致部分核心人才選擇出走。 這是一篇關於 DeepMind 科學家憑 AI 預測蛋白質 3D 結構(AlphaFold)獲諾貝爾獎的報導截圖。 技術對齊與 Anthropic 的研究方向 與此同時,研究員 Arthur Conmy 也宣布加入 Anthropic,並將專注於「對齊即將推出的模型」。他強調,目前的 Claude 模型雖然能力卓越,但尚未達到足以安全委託其進行 AGI 開發的對齊程度。他分享了 Anthropic 於 2026 年 5 月發布的技術文章「Teaching Claude Why」,該文探討了如何透過以下方式提升模型的對齊穩健性: 訓練模型針對倫理困境提供建議,而非僅僅在特定情境下執行任務。 使用關於 Claude 憲法(Constitution)的文件或虛構的 AI 行為故事進行訓練,這些資料雖與實際評測集分布差異極大(OOD),卻能有效提升模型表現。 在無害性 RL 環境中加入工具定義,即使這些工具對使用者請求並無直接幫助,也能顯著降低 Agent 的對齊失效(misalignment)機率。 Arthur Conmy 指出,單純針對評測指標進行訓練往往會導致過度擬合,無法推廣至分布外(OOD)的情境。Anthropic 的策略是教導模型理解「為什麼」某些行為優於其他行為,並透過憲法文件與高品質的 SFT(監督式微調)來建立模型對原則的理解,而非僅僅模仿對齊後的行為表現。 產業觀點與後續效應 針對人才流動現象,Google DeepMind 執行長 Demis Hassabis 在坎城的一場活動中回應,強調 AI 領域的人才流動極為頻繁,且 Google 仍擁有業界最廣泛的研究團隊。然而,社群觀察者如 Lucas Beyer(bl16)則指出,近期大量離職者多為長期駐紮倫敦的 DeepMind 老兵,這可能暗示了 Google 內部預訓練工作的重心正逐漸向美國山景城(MTV)轉移,導致部分研究人員因資源分配或地理因素選擇離開。 Google 工程與 DevRel 主管 Addy Osmani 在任職 14 年後發文分享職涯感悟並宣布離職。

    原文:https://easyvibecoding.app/curated/2199

  • Devin 推出自動化測試與錄影功能,讓使用者在合併 PR 前能透過端到端測試影片確認功能運作。 核心功能與流程 Cognition 團隊宣布 Devin 現已支援「測試模式」,該功能旨在解決開發者在審核程式碼時,難以即時驗證變更是否如預期運作的痛點。當 Devin 建立 PR 後,會主動提供測試選項,其自動化工作流程包含: 環境準備:自動安裝依賴、啟動服務並登入必要帳號。 測試規劃:根據程式碼變更內容,規劃出最關鍵的端到端測試路徑,並在執行前向使用者確認測試計畫。 執行與錄影:在桌面環境中執行測試,同時進行螢幕錄影。系統會自動進行「自動縮放(Auto-zoom)」與「標註(Annotations)」,將錄影重點聚焦於關鍵互動,並壓縮閒置時間。 結果回饋:將處理後的錄影檔直接作為訊息附件發送,讓使用者能快速檢視並決定是否合併 PR。 測試優化與實務建議 為了提升測試效率,Devin 整合了 skill 機制,讓使用者能透過 skill 定義測試步驟,並在測試完成後,Devin 會建議將成功的測試流程儲存為 skill 以供後續重複使用。官方建議在編寫 skill 時應保持具體,例如明確指出「點擊右上角的儲存按鈕」而非模糊的「測試儲存功能」。 若要手動建立測試 skill,可參考以下格式: `markdown --- name: test-before-pr description: Run the local dev server and verify pages before opening any PR that touches frontend code. --- Setup Install dependencies: npm install Start the database: docker-compose up -d postgres Run migrations: npx prisma migrate dev Start the dev server: npm run dev Wait for "Ready on http://localhost:3000" Verify Read the git diff to identify which pages changed Open each affected page in the browser Check for: console errors, layout issues, broken links Screenshot each page at desktop (1280px) and mobile (375px) widths Before Opening the PR Run npm run lint and fix any issues Run npm test and confirm all tests pass Include screenshots in the PR description ` 實際應用案例 影片展示了開發者使用 AI 輔助工具在「Lumen Desk」票務系統中新增「優先級(Priority)」篩選功能的完整開發與測試流程。 在「Lumen Desk」票務系統的開發場景中,Devin 透過此流程成功實作了「優先級」篩選功能。在測試階段,Devin 自動執行了 8 項測試案例,涵蓋了狀態篩選、搜尋、重置及標籤顯示等功能,並透過錄影展示了使用者在介面選擇「緊急」或「中」優先級後,頁面即時更新且 URL 參數正確變更的過程,確保了功能的穩健性。更多詳細資訊可參考 Devin 官方文件。

    影片展示了開發者使用 AI 輔助工具在「Lumen Desk」票務系統中新增「優先級(Priority)」篩選功能的完整開發與測試流程。 影片中的 Prompt 與操作:

    Prompt(00:00): 請在票務頁面新增一個優先級篩選器。 功能需求: 1. 在 /tickets 頁面新增一個「依優先級篩選」下拉選單,放在現有的狀態篩選器旁邊。 2. 下拉選單應包含: - 「所有優先級」 - 低 - 中 - 高 - 緊急 3. 選擇優先級後應立即提交/更新頁面,如同狀態篩選器的運作方式。 4. 篩選器應使用 'priority' 查詢參數,例如 /tickets?priority=Urgent。

    原文:Please add a Priority filter to the Tickets page. Feature requirements: 1. Add a "Filter by priority" dropdown to /tickets, next to the existing status filter. 2. The dropdown should include: - "All priorities" - Low - Medium - High - Urgent 3. Selecting a priority should immediately submit/update the page, like the status filter does. 4. The filter should use a 'priority' query param, for example /tickets?priority=Urgent.

    操作步驟: 1. (00:00)於輸入框輸入需求並送出。 2. (00:12)點擊「Filter by priority」下拉選單。 3. (00:13)選擇「Urgent」選項。 4. (00:16)點擊「Filter by priority」下拉選單。 5. (00:17)選擇「Medium」選項。 6. (00:19)點擊「Reset」按鈕。 7. (00:26)點擊票務列表中的項目進入詳情頁。 8. (00:28)點擊「New ticket」按鈕。

    原文:https://easyvibecoding.app/curated/2192

  • Notion 整合 Cursor 推出專屬 Agent 自動化開發任務。 核心整合功能 Notion 與 Cursor 攜手推出的這項整合,將 Cursor 的 Agent 能力直接嵌入 Notion 的任務管理流程中。這意味著開發團隊現在可以將「修復錯誤」、「開發新功能」或「程式碼審查」等具體工程任務,直接指派給 Cursor Agent 處理。該 Agent 具備以下關鍵特性: 任務透明化:所有 Cursor 的執行過程均保持可見且可審查,並與 Notion 中的任務看板緊密連結。 端到端自動化:當使用者將任務卡片(例如「Feature Requests」看板中的需求)指派給 Cursor 時,Agent 會自動讀取任務簡報(brief)、分析程式庫,並最終開啟一個 PR(Pull Request)。 跨平台銜接:使用者可選擇在 Notion 發起工作,隨後無縫切換至 Cursor 繼續執行。系統會為每個工作階段建立一個「Cursor Cloud Agent」,自動同步使用者的環境設定、權限與連接資訊,確保工作進度不中斷。 這張圖展示了 Notion 軟體中整合 Cursor AI 工具的應用情境,透過對話介面協助使用者排查並修復重複通知的程式錯誤。 實際操作流程 根據演示,這項整合透過視覺化的看板操作來驅動開發流程: 任務指派:在 Notion 的「Feature Requests」看板中,將任務卡片(如「Version history diff view and named snapshots」)從「Plan」欄位拖曳至「Build」欄位,即可觸發 Cursor Agent 的自動化作業。 自動化執行:系統會啟用「Cursor Investigator」代理工具,透過畫面顯示的 claude-3.5-sonnet 模型並結合 MCP(Model Context Protocol)進行運作。 執行步驟:Agent 會自動執行「Fetch」資料、分析需求(如表單整合需求)、思考解決方案,並透過 create-comment 與 fetch 等指令與 Notion 互動。 進度更新:Agent 完成工作後,會更新任務狀態。使用者可將卡片從「Build」拖曳至「Review」,最後確認「Cursor Builder is ready for review」的更新訊息,並將任務移至「Done」。 這是一個展示專案管理看板介面的操作演示,透過拖曳卡片來更新任務狀態。 技術與協作價值 此項整合的核心在於將「非技術人員的任務需求」與「技術人員的程式碼庫」透過 Agent 連結起來。透過將 Cursor 的執行環境與 Notion 的專案管理邏輯綁定,團隊成員無需具備深厚的技術背景,也能將真實的工程任務委派給 Agent。這種設計不僅提升了開發效率,更透過將 Agent 的「思考過程」與「執行結果」直接呈現在專案管理介面上,解決了過去 AI 輔助開發中常見的「黑箱作業」問題,讓開發進度變得完全可追蹤且具備高度的協作性。 透過 Cursor Investigator 代理工具自動化處理 Notion 資料庫中的功能需求與任務更新。

    這是一個展示專案管理看板介面的操作演示,透過拖曳卡片來更新任務狀態。 影片中的 Prompt 與操作:

    操作步驟: 1. (00:00)點擊「Version history diff view and named snapshots」卡片 2. (00:02)將「Version history diff view and named snapshots」卡片拖曳至「Build」欄位 3. (00:18)將「Bulk page move and reorganize across teamspaces」卡片拖曳至「Review」欄位 4. (00:26)將「Version history diff view and named snapshots」卡片拖曳至「Review」欄位 5. (00:28)點擊「Version history diff view and named snapshots」卡片查看更新 6. (00:33)將「Version history diff view and named snapshots」卡片拖曳至「Done」欄位

    透過 Cursor Investigator 代理工具自動化處理 Notion 資料庫中的功能需求與任務更新。 影片中的 Prompt 與操作:

    Prompt(00:00): 詢問 Cursor Investigator...

    原文:Ask Cursor Investigator...

    操作步驟: 1. (00:00)點擊輸入框並開始與 Cursor Investigator 對話。 2. (00:06)系統自動執行一系列 MCP 工具呼叫以更新 Notion 內容。

    原文:https://easyvibecoding.app/curated/2184

  • Notion 整合 Claude agents 實現自動化任務。 核心功能與應用場景 Notion 此次推出的 Claude agents 旨在將 AI 代理深度嵌入團隊協作流程中,使用者無需切換應用程式即可完成複雜工作。其關鍵能力包括: 自動化工作流:Agent 可串聯多項任務,並在團隊共享的任務看板上協作,實現 24 小時不間斷的作業循環。 這張圖片展示了在 Notion 平台中整合 Claude Agents 的應用場景,透過對話介面讓 AI 代理協助處理 Excel 財務預測與簡報製作等工作流程。 文件與檔案生成:Agent 能讀取專案頁面資訊、連結外部工具,並直接在 Notion 頁面產出如 PowerPoint 簡報、試算表或精緻文件。例如,透過指令即可自動生成包含專案架構、技術堆疊(如 Next.js 19、TypeScript 5)的完整簡報檔案。 使用者透過 AI 助理在文件協作平台上自動生成簡報檔案的演示過程。 技術開發支援:針對程式開發需求,Agent 可讀取程式庫、解析 PRD(產品需求文件),並自動填補技術細節、更新規格說明,甚至提供包含無障礙設計與樣式調整的完整實作方案,讓團隊成員直接在文件中進行編輯與評論。 影片展示了在專案管理介面中,透過 AI 代理協助自動撰寫技術規劃與程式碼實作的過程。 系統設定與權限管理 Claude agents 目前處於 Beta 測試階段,主要針對 Business 與 Enterprise 方案使用者開放。 部署方式:在 Notion 側邊欄點選「Agents」並選擇「New Agent」後,可選擇使用預設模板(如程式開發模板)或從零開始自訂指令、觸發條件與連接設定。 權限控制:Agent 的權限與 Notion 既有的 Custom Agents 邏輯一致,僅能存取使用者明確授權的頁面或資料庫。針對 Enterprise 與 HIPAA 工作空間,此功能預設為關閉,需由管理員至「Settings → Notion AI → Agent → Manage external agents」手動啟用。 運作機制:Agent 由 Notion 透過 Anthropic 的基礎設施託管,無需使用者自行註冊 Anthropic 帳號。計費方式則依據執行次數扣除 Notion credits。 故障排除與注意事項 若功能無法正常運作,建議依序執行以下檢查: 確認工作空間是否已啟用該功能(功能正逐步推廣中)。 確認 Agent 已正確加入工作空間並完成初始化。 檢查 Agent 的分享範圍與存取層級(如「Can view」或「Can edit」),確保其具備存取目標頁面或資料庫的權限。 若為企業內部環境,Agent 可能需要經過審核流程才能在工作空間中顯示。

    使用者透過 AI 助理在文件協作平台上自動生成簡報檔案的演示過程。 影片中的 Prompt 與操作:

    Prompt(00:03): @Claude 請為這個專案製作一份簡短的 PowerPoint 簡報。只要 3 頁。

    原文:@Claude please make a short powerpoint presentation about this project. Just 3 slides.

    操作步驟: 1. (00:03)輸入指令要求製作簡報 2. (00:12)點擊下載生成的 Crumb.pptx 檔案 3. (00:21)開啟簡報檔案並瀏覽內容

    影片展示了在專案管理介面中,透過 AI 代理協助自動撰寫技術規劃與程式碼實作的過程。 影片中的 Prompt 與操作:

    Prompt(00:00): @Claude 你能填寫技術規劃嗎?

    原文:03: @Claude can you fill in the technical plan?

    操作步驟: 1. @00:03 使用者在評論區輸入請求 2. @00:07 AI 代理開始分析程式碼結構 3. @00:13 AI 代理自動更新任務描述中的技術規劃欄位 4. @00:17 AI 代理完成技術規劃撰寫並發布評論 5. @00:20 使用者向下捲動頁面查看完整的技術規劃細節 6. OGFRAME: 00:20

    原文:https://easyvibecoding.app/curated/2179

  • 在 Gemini 3.5 Flash 中引入電腦操作功能 (Computer Use) 電腦操作功能現在已成為 Gemini 3.5 Flash 內建的支援工具,為 Agentic 程式開發任務提供了我們目前最佳的效能表現。過去,電腦操作功能僅能透過獨立的 Gemini 2.5 電腦操作模型使用,現在則已原生整合至 Gemini Flash 主模型中。Gemini 在函式呼叫 (function calling) 以及使用搜尋 (Search) 和地圖 (Maps) 基礎定位等內建工具方面表現卓越。隨著內建電腦操作能力的加入,開發者現在可以使用 3.5 Flash 來可靠地建構自訂 Agent,使其能夠在瀏覽器、行動裝置和桌面環境中進行觀察、推理並採取行動。這為長週期任務與企業自動化任務(例如持續軟體測試以及跨專業應用程式的知識工作)帶來了效能上的提升。 展開數據表模型OSWorld-VerifiedGemini 3.5 Flash78.4Gemini 3 Flash65.1Gemini 3.1 Pro76.2Sonnet 4.678.4Opus 4.883.4GPT-5.4 mini72.1GPT-5.578.7 確保 3.5 Flash 電腦操作功能的安全性 為了減輕 Agent 在即時環境中運作時可能面臨的部分 Prompt 注入風險,我們針對 Gemini 3.5 Flash 的電腦操作功能進行了針對性的對抗性訓練。我們同時發布了兩套選用的企業級安全防護系統,讓企業能夠: 針對敏感或不可逆的操作,要求使用者進行明確確認。 若偵測到間接 Prompt 注入,自動停止任務。 我們採取「縱深防禦」(defense-in-depth) 的策略,鼓勵開發者將這些功能與安全的沙盒 (Sandbox)、人機協作驗證 (human-in-the-loop verification) 以及嚴格的存取控制相結合。關於安全措施的更多資訊,請參閱我們的最佳實踐文件。 我們已經看到客戶透過電腦操作功能創造了價值。以下是部分客戶的見解: Browserbase:「在 OnlineMind2Web 和私有基準測試中,具備電腦操作功能的 Gemini 3.5 Flash 提供了與頂尖模型相當的準確度,且具備更好的成本與延遲表現,使得執行複雜、長週期的瀏覽任務在規模化運作時變得更具經濟效益。」—— Miguel González Fernández,Browserbase Browser Use:「Gemini 3.5 Flash 在 Agentic 瀏覽器操作 harness 上,比起前一代 Flash 有顯著的進步。它在保持速度與成本優勢的同時,達到了頂尖水準的效能,這讓 Google 成為我們大規模應用時的首選。」—— Magnus Müller,執行長,Browser Use UIPath:「Gemini 3.5 Flash 特別適配於驅動 Delegate 和 ScreenPlay 等 Agent 的 UIPath 電腦操作 harness。在我們評估過的所有電腦操作模型中,Gemini 3.5 Flash 提供了高吞吐量、強大的可靠性以及最佳的性價比,同時還非常容易進行引導與控制。」—— Alvin Stanescu,資深總監,UIPath 立即開始使用電腦操作功能進行開發: 立即試用:在 Browserbase 託管的展示環境中測試各項功能。 開始建構:透過 Gemini API 與 Gemini Enterprise Agent Platform 深入了解我們的參考實作與文件。

    原文:https://easyvibecoding.app/curated/2183

  • Notion 推出 External Agents 實現 AI 協作。 Notion 官方正式發布 External Agents 功能(目前為 Beta 階段),這項更新讓團隊能將 Claude 與 Cursor 等 AI 代理視為虛擬隊友,直接整合進現有的 Notion 看板與文件工作流程中。使用者現在可以透過 @ 標記呼叫這些 Agent,讓它們參與任務排程、自動化執行工作,甚至在使用者離線時持續運作。 Notion 整合 Claude 與 Cursor 外部 AI 代理,實現自動化工作流程。 核心功能與協作模式 團隊協作整合:Agent 可被指派至共享看板,並像真人隊友一樣被 @ 提及。它們能讀取共享文件、分析任務需求,並在看板上更新狀態。 自動化工作流:支援多個 Agent 並行作業或排程執行,從任務分析、撰寫程式碼修復到建立 PR(Pull Request),實現端到端的自動化。 透明化管理:所有 Agent 的執行過程對團隊皆具備完整可見度,確保工作進度隨時可追蹤。 權限控管:使用者可針對每個 Agent 設定精確的存取權限(如僅檢視、可編輯或完整存取),確保 Agent 僅能接觸到被授權的資料。 實際應用場景 根據演示,Notion 整合了 Claude 與 Cursor 的協作流程: 任務分析:Claude Agent 可自動分析看板上的 Bug 報告,從 workspace 提取上下文,並在頁面上更新修復計畫。 開發與部署:經由團隊成員確認後,Cursor Agent 可接手進行程式碼建置,自動完成測試並建立 PR,最後將任務狀態推進至「Ship」階段。 流程自動化:Agent 可根據觸發條件(如任務被提及或移動至特定欄位)自動執行預設任務,大幅減少手動更新看板的時間。 這段影片展示了如何使用 AI 代理在 Notion 看板中自動化管理與規劃功能需求。 設定與管理指引 啟用方式:目前此功能適用於 Business 與 Enterprise 方案。Enterprise 與 HIPAA 工作空間預設為關閉,管理員需前往 Settings → Notion AI → Agents → Manage external agents 進行啟用。 建立 Agent:在側邊欄進入 Agents → New Agent → Claude。使用者可選擇使用預設模板(如程式開發模板)或從零開始設定指令、觸發條件與連接。 權限設定:在 Agent 的 Tools and access 設定中,可管理其對特定頁面或資料庫的存取層級。 計費機制:Claude Agent 的執行透過 Notion credits 計算,並依據每次執行(per run)收費,無需額外建立 Anthropic 帳號。 影片展示了在 Cursor 平台中設定 AI Agent 的權限管理與工具連接的操作流程。 注意事項 Beta 限制:此功能目前為 Beta 階段,正逐步向使用者開放,部分工作空間可能尚未看到選項。 功能邊界:目前的 Claude Agent 不支援網頁瀏覽,且在單次會話中無法呼叫其他 Agent。 故障排除:若功能異常,請確認該功能已在工作空間啟用、Agent 已正確加入,並檢查 Agent 對目標頁面是否具備足夠的存取權限。

    Notion 整合 Claude 與 Cursor 外部 AI 代理,實現自動化工作流程。 影片中的 Prompt 與操作:

    操作步驟: 1. (00:03)點擊任務卡片「Bug: onboarding import failing」 2. (00:12)點擊 Claude Agent 的通知連結 3. (00:15)在評論區輸入指令並標記 @Cursor 4. (00:22)點擊 GitHub 連結

    這段影片展示了如何使用 AI 代理在 Notion 看板中自動化管理與規劃功能需求。 影片中的 Prompt 與操作:

    Prompt(00:07): 收到 - 我現在開始調查以指派來源、優先級和團隊,然後我會將其移至「規劃」階段。

    原文:On it - investigating this now to assign a source, priority, and team, then I'll move it to the Plan stage.

    Prompt(00:16): 收到 - 現在正在撰寫實作計畫。

    原文:On it - writing an implementation plan now.

    Prompt(00:19): 這是計畫:# 未找到 它涵蓋三個工作流: - 工作流 A - 自訂區塊與手動分組(關鍵路徑:新的 SidebarLayout 資料模型、API 端點、側邊欄渲染器變更、區塊 CRUD UI 以及 A 收藏夾遷移) - 工作流 B - 建立在 A 之上的每區塊排序選項(字母順序、最近、手動)。 - 工作流 C - 用於在已儲存版面配置之間切換的側邊欄預設(例如:「工作」對比「個人」)。 該計畫還包括分階段發布(內部測試 -> Beta -> GA)、風險緩解和成功指標。幾個懸而未決的問題已標記供設計和同步團隊審查。

    原文:Here is the plan: # Not found It covers three workstreams: - Workstream A - Custom sections & manual grouping (critical path: new SidebarLayout data model, API endpoints, sidebar renderer changes, section CRUD UI, and A favorites migration) - Workstream B - Per-section sort options (alphabetical, recent, manual) built on top of A. - Workstream C - Sidebar presets for switching between saved layouts (e.g., "Work" vs. "Personal"). The plan also includes a phased rollout (internal dogfood -> Beta -> GA), risk mitigations, and success metrics. A few open questions are flagged for design and sync-team review.

    操作步驟: 1. (00:07)Claude Investigator 留言並將卡片拖曳至 Plan 欄位 2. (00:10)Claude Investigator 將另一張卡片拖曳至 Plan 欄位 3. (00:16)Cursor PRD 留言 4. (00:18)Cursor PRD 留言並提供詳細計畫 5. (00:20)Cursor PRD 將卡片拖曳至 Build 欄位

    影片展示了在 Cursor 平台中設定 AI Agent 的權限管理與工具連接的操作流程。 影片中的 Prompt 與操作:

    操作步驟: 1. (00:00)點擊「Share」按鈕開啟權限設定選單。 2. (00:03)在權限下拉選單中選擇「Full Access」。 3. (00:07)捲動頁面查看「Triggers」與「Instructions」設定。 4. (00:08)點擊「Notion」工具下的權限選單。 5. (00:10)在權限選單中選擇「Full access」。 6. (00:12)查看「Advanced」區塊中的 GitHub 儲存庫連接與模型選擇。

    原文:https://easyvibecoding.app/curated/2195

  • OpenAI 推出首款自研 AI 晶片 Jalapeño。 OpenAI 於 2026 年 6 月 24 日正式推出首款專為大型語言模型(LLM)推論設計的 AI 加速器「Jalapeño」。該晶片由 OpenAI 從零開始設計,並與 Broadcom 合作進行生產,旨在為 ChatGPT、Codex、API 以及未來的 Agent 產品提供更高效的運算基礎。OpenAI 總裁 Greg Brockman 指出,Jalapeño 的開發週期僅歷時九個月,且在設計過程中大量運用了 OpenAI 自家的模型來加速優化,目前早期測試顯示其每瓦效能表現極為出色。 OpenAI 執行長 Sam Altman 與 Broadcom 執行長陳福陽共同展示一塊刻有「Jalapeño Intelligence Processor」字樣的晶圓。 核心設計理念 Jalapeño 並非傳統通用型加速器的改良版,而是針對現代 LLM 推論需求量身設計的專用晶片,其設計重點包括: 全端優化:針對 OpenAI 內部的核心運算需求(如 kernels、記憶體移動、網路傳輸及服務模式)進行架構調整,以達到接近理論峰值的運算利用率。 軟硬體協同:透過減少資料移動並平衡運算、記憶體與網路資源,顯著提升推論效率。 快速開發週期:透過 OpenAI 的軟體工程團隊與 Broadcom 的矽晶片實作經驗結合,創下了高效能先進半導體領域中最快的 ASIC 開發紀錄。 策略影響與未來展望 此次發布標誌著 OpenAI 在「全端平台」策略上的重大進展,將影響力從模型與產品層面延伸至底層基礎設施。 降低推論成本:透過提升每瓦效能,OpenAI 旨在讓 AI 服務變得更快速、更可靠且更具經濟效益,進而推動 AI 的普及化。 多世代路線圖:Jalapeño 僅是與 Broadcom 及 Celestica 合作計畫的第一步,預計於 2026 年底開始部署,並將在未來數年內持續擴展,目標是支援 gigawatt 等級的資料中心運作。 正向循環:OpenAI 強調,更高效的基礎設施能驅動更強大的模型訓練與服務,進而創造更好的產品體驗,並透過增加的使用量與營收,持續投入下一代基礎設施的研發。 目前,Jalapeño 的工程樣本已在實驗室中執行包括 GPT-5.3-Codex-Spark 在內的 ML 工作負載,詳細的效能技術報告預計將在未來幾個月內公佈。

    原文:https://easyvibecoding.app/curated/2176

  • Hermes Agent 推出 /learn 指令自動提煉技能。 核心功能與 /learn 指令 Nous Research 推出的 Hermes Agent 新增了 /learn 指令,旨在簡化 skill 的建立流程。使用者無需手動撰寫 SKILL.md,只需提供目錄、程式碼、API 文件、PDF 或操作手冊等原始資料,Agent 便會自動進行資料蒐集與分析,並依據標準格式產出可驗證的 skill。該功能支援多種輸入方式: 本地路徑:例如 /learn the REST client in ~/projects/acme-sdk。 線上文件:直接輸入 URL,如 /learn https://docs.example.com/api/quickstart。 對話脈絡:將剛完成的互動流程轉化為 skill,例如 /learn how I just deployed the staging server。 文字描述:直接貼上筆記或流程說明。 技術運作與整合 這段影片展示了名為 NOUS 的系統如何處理資料並進行驗證的流程。 /learn 指令並非透過獨立的擷取引擎運作,而是直接由 Agent 運用現有工具(如 readfile、webextract)進行處理,確保在 CLI、TUI 或 Dashboard 等不同介面下均能一致運作。產出的 skill 會遵循標準化規範(如 60 字元以內的描述、標準章節順序),並透過 skill_manage 工具儲存,若已開啟寫入審核機制,則需經使用者確認後方可儲存。 Skills 系統管理 Hermes Agent 的 skill 系統設計為按需載入,以降低 token 使用量並相容於 agentskills.io 開放標準。所有 skill 預設存放於 ~/.hermes/skills/ 目錄下。使用者若希望自訂環境,可透過以下指令管理預設的 skill 組合: 安裝時排除預設 skill: `bash curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash -s -- --no-skills ` 建立設定檔時排除: `bash hermes profile create research --no-skills ` 執行期間調整: `bash hermes skills opt-out 停止未來自動同步 hermes skills opt-out --remove 刪除未經修改的預設 skill hermes skills opt-in --sync 重新啟用並同步 ` 此系統確保了 Agent 的擴充性,讓使用者能透過 /learn 快速累積個人化的自動化工作流,並透過 / 開頭的指令(如 /plan 或 /excalidraw)隨時呼叫使用。

    這段影片展示了名為 NOUS 的系統如何處理資料並進行驗證的流程。 影片中的 Prompt 與操作:

    操作步驟: 1. (00:02)匯入 PDF 來源文件 2. (00:07)系統提煉文件內容 3. (00:10)系統進行測試與保存 4. (00:13)系統完成驗證並顯示標章 5. (00:20)輸入 /learn 指令

    原文:https://easyvibecoding.app/curated/2173

  • OpenAI Developers 發布 API 平台更新。此次更新涵蓋了從高效能模型到 Agent 開發基礎設施的全面升級,旨在強化開發者在建構複雜應用時的靈活性與控制力。 一位講者正在介紹 OpenAI API 近期的功能更新與開發者工具。 模型陣容擴充 OpenAI 擴充了模型生態系,提供更多元化的選擇以應對不同運算需求: 新增大型語言模型:GPT-5.5、GPT-5.4 mini 與 GPT-5.4 nano。 即時互動系列:推出 GPT-Realtime-2(具備進階推理能力)、GPT-Realtime-Whisper 與 GPT-Realtime-Translate。 視覺生成:推出 GPT-Image-2,支援自訂長寬比與 4K 高解析度輸出。 Agent 開發基礎設施 為了讓開發者更順暢地建構 Agent,OpenAI 導入了一系列關鍵組件: 提供專用的 Agents SDK harness 與 sandbox 環境,確保 Agent 執行過程的隔離性與穩健性。 在 Responses API 中加入 skill 支援,並引入 Server-side compaction 以優化效能。 支援 WebSocket 模式以降低互動延遲,並提供 Hosted shell 讓開發者能直接在雲端環境執行程式碼。 管理與部署彈性 針對企業級應用與開發流程,OpenAI 強化了管理與整合能力: 推出 Admin API,開發者可透過 SDK 或 OpenAI CLI 進行 API 金鑰管理(支援 GET、POST、DELETE 操作)。 支援模型部署至 Amazon Bedrock,開發者可透過調整 config.toml 設定檔進行整合,例如設定 model_provider = "amazon-bedrock"。 透過視覺演示顯示,開發者現已能更高效地在 workspace 中進行程式碼執行與 UI 互動,例如在「Dachshund Dash」遊戲開發案例中,透過整合上述工具實現了端到端的開發流程。

    一位講者正在介紹 OpenAI API 近期的功能更新與開發者工具。 影片中的 Prompt 與操作:

    Prompt(00:55): 使用 @Image Gen 設計一款復古貪食蛇遊戲,主角是一隻追逐零食的臘腸犬。

    原文:Use @Image Gen to design a retro Snake game with a dachshund that chases treats.

    Prompt(00:59): 將其製作成瀏覽器遊戲!

    原文:Build this as a browser game!

    操作步驟: 1. (00:55)點擊「Image Gen」工具生成遊戲畫面。 2. (00:59)點擊「Build this as a browser game!」按鈕進行程式開發。 3. (02:16)點擊「Admin APIs」選單。 4. (02:19)點擊「Admin API Keys」選單。 5. (02:21)點擊「Projects」選單。

    原文:https://easyvibecoding.app/curated/2174

  • Aside 推出 AI 瀏覽器實現自動化任務處理。 核心產品定位 由 @hyojun_at (jun) 開發的 Aside 是一款標榜能執行「真正工作」的 AI 瀏覽器,旨在解決傳統 AI 助手在處理跨網站、跨帳號或敏感任務時,經常出現拒絕回應(如「I can't do that」)的問題。該瀏覽器在設計細節上導入了垂直分頁(vertical tabs)與 Liquid Glass 介面,並強調能透過「瀏覽器 Agent(Browsing Agent)」機制,自動化執行取消訂閱、查詢信用卡帳單及與客服對話等繁瑣流程。 Aside 是一款專為處理複雜、長時程任務所設計的 AI 瀏覽器。 效能與技術基準 Aside 在效能表現上展現了極高的競爭力,根據官方數據: 在 Online-Mind2Web 基準測試中,搭載 GPT-5.5 的 Aside 達到 99% 的任務完成率,表現優於 Claude Fable 等現有解決方案。 該工具專為複雜、長時程的網頁互動設計,能有效克服傳統 AI 模型在跨網頁操作時的限制。 隱私與整合性 Aside 強調隱私優先的架構,確保所有處理過程均在本地端執行並加密,不會洩漏使用者的密碼等敏感資訊。此外,該瀏覽器具備高度的靈活性,使用者可以直接串接並使用個人既有的 Claude 或 ChatGPT 訂閱服務,無需額外購買專屬 AI 服務。 欲了解更多詳情或體驗產品,請參考 Aside 官方網站。

    Aside 是一款專為處理複雜、長時程任務所設計的 AI 瀏覽器。 影片中的 Prompt 與操作:

    Prompt(00:28): 取消所有未使用的訂閱並申請退款

    原文:cancel all unused subscriptions and request refunds

    操作步驟: 1. (00:27)在搜尋框輸入指令 2. (00:35)點擊「Open chase.com」 3. (00:39)點擊「Sign in to Chase with Jun's Chase Passkey」 4. (00:40)點擊「Open last month's credit card statement」 5. (00:49)點擊「Starting a chat with the support」 6. (00:50)點擊「Asking for a refund」 7. (01:57)點擊密碼輸入框旁的眼睛圖示以隱藏密碼

    原文:https://easyvibecoding.app/curated/2166

  • Justin Poehnelt 因開發 Google Workspace CLI 遭 Google 解僱,該工具旨在為人類與 Agent 提供統一的 workspace 互動介面。 這是一張社群媒體貼文截圖,展示了關於 Google Workspace CLI 工具的發布與相關討論。 事件背景與離職始末 Justin Poehnelt 在 Google 任職近 7 年,於兩個月前因開發並發布「Google Workspace CLI」(gws)遭公司解僱。該工具在發布後迅速於 Hacker News 登上榜首,並在 GitHub 獲得數千顆星與大量使用者。Justin Poehnelt 指出,儘管該專案獲得了許多內部主管的關注,但也引發了法務部門對品牌商標與配色使用的質疑。他認為,此次解僱反映了 Google 內部對於 Agent 技術將如何顛覆現有 workspace 產品架構的深層恐懼,且諷刺的是,在他離職前兩天,Google Cloud Next 大會才剛宣布將推出官方版的 workspace CLI。 工具核心功能與設計 Google Workspace CLI(gws)是一個專為人類與 AI Agent 設計的命令列工具,其核心特點包括: 動態指令生成:不依賴靜態指令列表,而是透過執行時期讀取 Google 的 Discovery Service,自動建構完整的指令介面。 Agent 友善設計:所有回應皆為結構化的 JSON 格式,並內建超過 40 個 Agent skill,讓大型語言模型能在無需額外客製化工具的情況下管理 workspace。 多樣化支援:涵蓋 Drive、Gmail、Calendar 等所有 workspace API,並提供 --dry-run 預覽請求與自動分頁功能。 安全性與整合:支援多種認證流程(包含本地桌面、CI 環境與服務帳號),並透過 gws auth setup 等指令簡化 Google Cloud 專案設定與 OAuth 流程。 快速上手與使用指引 使用者可透過以下方式安裝並啟用該工具: 安裝方式(推薦使用 npm): `bash npm install -g @googleworkspace/cli ` 初始設定與認證: `bash gws auth setup 設定 Google Cloud 專案與 OAuth gws auth login 進行後續登入 ` 執行指令範例: `bash 列出最近 5 個檔案 gws drive files list --params '{"pageSize": 5}' 發送 Chat 訊息 gws chat spaces messages create --params '{"parent": "spaces/xyz"}' --json '{"text": "Deploy complete."}' ` Agent 整合與擴充 該專案提供了豐富的 Agent 資源,包含超過 100 個 SKILL.md 檔案,涵蓋各類 API 操作與工作流食譜。使用者可透過 npx skills add https://github.com/googleworkspace/cli 安裝所有 skill,或針對特定服務(如 gws-drive、gws-gmail)進行安裝。此外,該工具亦提供 Gemini CLI 擴充功能,安裝後可讓 Gemini Agent 直接呼叫 gws 指令,並自動繼承終端機已驗證的憑證。更多詳細資訊可參考 GitHub 專案頁面。

    原文:https://easyvibecoding.app/curated/2161

  • Noah Zweben 發表了 Claude Tag 的「Agent identity」存取模型,說明如何透過獨立的服務帳號為團隊協作的 AI 代理配置權限。 核心概念與設計目標 Noah Zweben 指出,AI 代理自主性越來越高(任務完成能力每四個月翻倍)、多人協作場景也越來越多,傳統「代理使用者權限」的模式已不再適用。Claude Tag 引入了「Agent identity」模型,讓 Claude 在團隊頻道中擁有獨立的服務帳號,而非依賴單一使用者的憑證。此舉確保了: 權限隔離:Claude 的操作與特定使用者脫鉤,避免個人帳號成為存取敏感文件的後門。 多人協作:在多人共用的頻道中,Claude 的權限由管理員定義,而非取決於當下誰在與其互動。 權限繼承:管理員可定義 Workspace 層級的預設權限,並針對特定頻道進行覆寫,精確控管 Claude 能存取的 Repository、API Key、skill 與 plugin。 影片展示了如何透過 Claude Tag 設定與管理 AI 代理的權限與存取範圍。 安全與管理機制 該模型透過將憑證與頻道身分綁定,做到細粒度的存取控制: 邊界管理:Claude 在私有頻道中的「記憶」與存取範圍被嚴格限制,不會跨頻道外洩。 稽核追蹤:所有透過 Agent 憑證執行的 routine、記憶寫入與網路呼叫,均會在各個連接的系統日誌中留下紀錄。 彈性配置:管理員可透過設定頁面建立「存取套件(Access bundles)」,將 Linear、Datadog、Asana 或 GitLab 等工具的憑證綁定至 Claude Tag,並透過 @Claude 指令在 Slack 中執行任務。 未來展望 Noah Zweben 強調,Claude Tag 的價值在於整合多種工具的上下文。未來 Anthropic 計畫推出「即時憑證授權(just-in-time credential grants)」,讓使用者能針對單一敏感操作進行即時批准,並導入身分感知覆蓋層(identity-aware overlay),讓企業級的安全控管更嚴謹。對於需要個人化工具(如 email 草稿)的場景,使用者仍可透過個人 claude.ai 帳號進行私訊互動。

    影片展示了如何透過 Claude Tag 設定與管理 AI 代理的權限與存取範圍。 影片中的 Prompt 與操作:

    Prompt(04:07): @Claude 建立一個測試 Linear 工單,內容為 Hello World

    原文:@Claude create a test linear ticket that says Hello World

    操作步驟: 1. (01:47)點擊 Claude Tag 管理介面 2. (02:05)點擊「Add access bundle」按鈕 3. (02:22)點擊「Create new bundle」 4. (02:29)輸入名稱「General Tooling」 5. (02:38)選擇並連接「Linear」應用程式 6. (03:36)點擊「Test connection」測試憑證 7. (03:40)點擊「Connect」完成連接 8. (03:48)將「General Tooling」存取組合綁定至工作區 9. (04:16)建立第二個存取組合「Data team」 10. (05:02)連接資料倉儲並設定 GCP 服務帳戶憑證 11. (05:34)將「Data team」存取組合綁定至特定頻道

    原文:https://easyvibecoding.app/curated/2169

  • Anthropic 推出 Claude Tag,讓 Claude 在 Slack 裡當團隊成員、自動接手交辦的任務。 核心功能與運作模式 Claude Tag 是 Claude Code 的進化版本,專為團隊協作設計,讓 AI 能在 Slack 頻道中與人類成員共同作業。其核心運作機制如下: 多人協作(Multiplayer):頻道中的 Claude 具有單一身份,團隊成員可接續彼此的對話或任務進度,無需重複說明脈絡。 主動式行為(Proactive Behavior):啟用後,Claude 會主動追蹤閒置的討論串、彙整跨頻道與工具的相關資訊,並在任務完成時主動回報。 非同步執行:使用者指派任務後即可轉向其他工作,Claude 會在背景拆解任務階段,並透過其存取的工具(如程式庫、資料庫)獨立完成工作。 自動化能力:Claude 可執行撰寫或合併 Pull Requests、資料分析、處理支援票務(Support tickets)及排解系統例外等任務。目前 Anthropic 內部產品團隊有 65% 的程式碼皆由內部版本的 Claude Tag 產出。 這支影片介紹了 Claude Tag 功能,展示 AI 如何在協作平台中與團隊成員共同處理任務。 技術架構與安全性 為了確保企業級應用,Claude Tag 在架構上採取了嚴格的隔離與權限控管: 沙盒隔離(Sandbox):當 Claude 在頻道中被標記時,會啟動一個具備獨立沙盒的執行個體,負責複製程式庫、編寫程式碼、測試與編譯,任務結束後該環境即被銷毀。 記憶與權限隔離:系統管理員可針對不同頻道設定 Claude 的存取權限與工具連結。不同頻道的 Claude 擁有獨立的「記憶」,確保工程部門的資料不會外洩至銷售部門,且 Claude 無法存取未經授權的憑證密鑰。 安全防護機制:Anthropic 在模型訓練階段、模型輸出的分類器層級,以及對 Claude 可存取的網站與工具進行多層次保護,確保其行為符合企業安全規範。 這是一張顯示開發團隊與 AI 代理在通訊軟體中進行技術討論與任務協作的截圖。 設定與導入流程 Claude Tag 目前已開放給 Claude Enterprise 與 Team 方案客戶進行 Beta 測試。管理員可透過以下步驟啟用: 將 Claude Tag 與 Slack workspace 進行配對。 授予 Claude 存取特定工具與資料來源的權限。 設定組織每月的 token 使用額度上限。 於私人頻道中進行測試,確認功能運作正常。 這張截圖展示了一個通訊軟體介面,其中名為「Claude」的 AI 代理正與團隊成員協作,自動執行更新部落格草稿、測試版邀請信及檢查產品回饋等任務。 專家觀點 Andrej Karpathy 指出,Claude Tag 代表了大型語言模型 UI/UX 的第三次重大變革。第一代是作為「網站」存在,第二代是作為「應用程式」存在,而 Claude Tag 則將 AI 定位為一個「具備組織級工具與記憶、能與人類團隊並肩工作的自主實體」。Boris Cherny 則補充,這不僅僅是一個 Slack 機器人,它透過「Claude Everywhere」的願景,讓 AI 能夠主動回應問題、撰寫程式碼並監控頻道狀態,成為 onboarding 新成員與提升團隊效率的關鍵解鎖工具。 如需進一步了解,可參考 Anthropic 官方公告 或相關技術文件。

    這支影片介紹了 Claude Tag 功能,展示 AI 如何在協作平台中與團隊成員共同處理任務。 影片中的 Prompt 與操作:

    Prompt(00:02): @Claude 你可以在接下來的幾個小時內負責分類工作嗎?

    原文:@Claude can you take triage for the next few hours?

    Prompt(00:22): 嘿 @Claude

    原文:hey @Claude

    Prompt(00:48): @Claude 建立排程匯出功能。services/export 中有一個存根,設計在 ATL-421 上

    原文:@Claude build scheduled exports. there's a stub in services/export, design's on ATL-421

    操作步驟: 1. (00:36)在 #product-eng-launches 頻道中進行討論 2. (00:46)在 #product-eng-launches 頻道中標記 @Claude 3. (00:50)Claude 回應並提出技術建議 4. (00:54)Claude 提出重構建議 5. (01:00)Claude 列出待辦清單並開啟 PR 6. (01:41)顯示 PR #4131 已建立並合併 7. (01:57)Claude 在 #launch 頻道中主動回報進度 8. (02:04)Claude 執行更新部落格與邀請信的任務

    原文:https://easyvibecoding.app/curated/2158

  • Apple 推出 container 工具讓 macOS 26 原生執行 Linux 容器。 這是一則關於 Apple 宣布 Linux 容器現已可在 macOS 上原生運行的開發者新聞公告。 核心變革與優勢 Ayaan 🐧 在貼文中指出,Apple 釋出的開源專案 container 正式改變了 Mac 上的容器化開發體驗。這項工具讓開發者無需再依賴 Docker Desktop,不僅省去了每月 21 美元的商業授權費用,更解決了背景常駐程式佔用大量記憶體的問題。其關鍵特性包括: 原生效能:利用 macOS 26 的虛擬化技術,將 Linux 容器作為輕量級虛擬機執行,並針對 Apple Silicon 晶片進行 Swift 語言優化。 完全相容:支援 OCI 標準,可直接拉取 Docker Hub 或 GitHub Container Registry 的映像檔。 無縫銜接:採用標準容器 CLI 語法,熟悉 Docker 指令的使用者可無痛轉換。 開源免費:以 Apache-2.0 授權釋出,且不需額外支付商業費用。 安裝與管理流程 該工具目前已在 GitHub 上獲得超過 26,500 顆星,專案處於活躍開發階段。若要開始使用,請參考以下步驟: 安裝:從 GitHub release 頁面 下載簽署過的安裝包,執行後依指示完成安裝,系統檔案將放置於 /usr/local。 啟動服務:安裝完成後,執行以下指令啟動系統服務: `bash container system start ` 升級與降級:若需更新或變更版本,請先停止服務: `bash container system stop ` - 升級至最新版:執行 /usr/local/bin/update-container.sh。 - 降級版本:使用 -k 旗標保留使用者資料,或 -d 移除資料,並指定版本號: `bash /usr/local/bin/uninstall-container.sh -k /usr/local/bin/update-container.sh -v 0.3.0 ` 移除工具:若需解除安裝,可使用 /usr/local/bin/uninstall-container.sh 腳本,並選擇保留(-k)或刪除(-d)使用者資料。 產業影響與觀察 Ayaan 🐧 認為,繼微軟透過 WSL Containers 讓 Docker Desktop 在 Windows 上變為選配後,Apple 的此舉象徵著「為個人電腦上的容器 GUI 封裝層付費」的時代正悄然結束。雖然 Docker 本身依然重要,但對於追求輕量、高效且原生整合的開發者而言,Apple 提供的這套方案無疑提供了更具成本效益與效能優勢的選擇。更多技術細節與 API 文件可參閱 Apple 官方文件。

    原文:https://easyvibecoding.app/curated/2171

  • Cline 團隊透過實際除錯測試,比較 GLM-5.2 與 Opus 4.8 在程式開發任務中的表現差異。 測試背景與結果 Cline 團隊針對自家程式庫中的真實 Bug 進行測試,以驗證社群關於 GLM-5.2 優於 Opus 4.8 的說法。儘管兩者皆成功修復問題,但在成本與程式碼品質上存在顯著差異: 成本與 token 使用量:GLM-5.2 使用了 110 萬個 token,成本為 0.41 美元;Opus 4.8 使用了 66 萬個 token,成本為 0.81 美元。GLM-5.2 的 token 用量雖為 Opus 的兩倍,但總成本僅為其一半。 執行效率:Opus 4.8 執行速度較快,耗時 1.6 分鐘並呼叫 12 次工具;GLM-5.2 耗時 4.7 分鐘並呼叫 28 次工具。 程式碼品質:GLM-5.2 在完成任務前會主動清理無用程式碼並驗證建置是否通過;Opus 4.8 則遺留了雖能通過測試但會導致正式環境建置失敗的型別錯誤。 在修復同一個 Bug 的測試中,GLM-5.2 成功完成乾淨建置且花費僅需 $0.41,而 Opus 4.8 則導致建置失敗且花費高達 $0.81。 技術觀察 Cline 團隊指出,兩者在相同的 harness 與 prompt 設定下,GLM-5.2 展現出透過強化學習(RL)訓練的特性,傾向於在完成任務前消耗更多 token 來驗證工作成果。團隊認為這解釋了為何使用者普遍回饋 GLM-5.2 的產出品質較佳。 社群回饋與後續計畫 針對社群對於單一測試樣本代表性的質疑,Cline 團隊回應如下: 團隊承認單一測試不足以作為全面性基準測試,強調這僅是針對自家 Bug 的實戰範例。 團隊已進行多次重複測試,觀察到 GLM-5.2 在驗證工作與避免破壞正式環境方面表現一致。 團隊計畫將實驗程式碼開源,並與 Morgan(@morganlinton)的 vulcanbench 專案合作,持續擴充測試語料。 針對未來發展,Cline 將持續優化對開源權重模型的支援,並預計推出訂閱方案,透過量大折扣進一步降低使用成本。

    原文:https://easyvibecoding.app/curated/2150

  • Hermes Agent 新增跨平台電腦操作,可在背景自動執行桌面動作。 核心功能與跨平台支援 Nous Research 宣布 Hermes Agent 的電腦操作功能(Computer Use)除了原有的 macOS 支援外,現已擴展至 Windows 與 Linux。該功能透過 cua-driver 驅動程式,讓 Agent 能在背景執行點擊、輸入、捲動與拖曳等動作,且不會搶佔使用者的滑鼠游標、鍵盤焦點或切換虛擬桌面,實現真正的「人機協作」。此工具集採用 MCP(Model Context Protocol)協定,相容於 Claude、GPT、Gemini 及各類支援工具呼叫的本地大型語言模型。 這段影片展示了某 AI 服務支援 Windows 與 Linux 電腦操作的公告,並顯示了相關的合作標誌。 安裝與設定指引 使用者可透過以下兩種方式啟用該功能: 直接執行 CLI 指令:hermes computer-use install。 互動式設定:執行 hermes tools 並選擇「Computer Use」。 安裝完成後,可透過 hermes computer-use doctor 進行系統診斷,確保權限與環境設定正確。若要啟動具備該功能的對話,請執行: `bash hermes -t computer_use chat ` 或在 ~/.hermes/config.yaml 設定檔中將 computer_use 加入啟用的工具集。 技術架構與進階應用 操作機制:Agent 透過各平台的輔助功能樹(Accessibility Tree)讀取視窗資訊,並發送合成事件,無需將視窗移至前景。 視覺回饋:Agent 執行動作時,螢幕會出現半透明的疊加游標,標示其操作位置,且每個 Agent 執行個體皆有獨立的 Session ID 與游標識別。 技能擴充:若需深入研究平台特定的操作細節(如 macOS 的 SkyLight 互動或 Windows 的 UIA 樹狀結構),可安裝 cua-driver 提供的 skill pack: `bash cua-driver skills install ` 安全性與效能:系統內建多層防護,包括對破壞性動作(如強制刪除、鎖定螢幕)的硬性阻擋,以及針對截圖的 token 優化策略(如截圖淘汰(只留最近 3 張)與上下文壓縮),以降低 API 使用成本。 注意事項 該功能目前在背景模式下的反應速度約為 5–20 ms,雖足以應付一般自動化任務,但若需進行高頻率的操作錄製,效能表現會受限。此外,部分現代應用程式(如未公開輔助樹的 UWP 或特定 Electron 版本)可能無法被正確識別,此時 Agent 將會退回到像素座標模式或跳過該任務。

    這段影片展示了某 AI 服務支援 Windows 與 Linux 電腦操作的公告,並顯示了相關的合作標誌。 影片中的 Prompt 與操作:

    操作步驟: 1. (00:00)顯示電腦操作支援公告 2. (00:06)顯示兩個品牌或服務的識別圖示

    原文:https://easyvibecoding.app/curated/2144

  • Loop Engineering 詳解 你的資訊來源中,有一半的人突然都在講同一件事:別再糾結於如何下 Prompt(提示詞)給你的 Agent 了,開始進行 Loop Engineering(迴圈工程)吧。 Claude Code 的開發者 Boris Cherny 說得很直白:「我不再給 Claude 下 Prompt 了。我現在執行的是迴圈。我的工作是編寫迴圈。」 這位打造了全球最受歡迎程式開發 Agent 之一的人,竟然不給它下 Prompt。那麼,他到底在做什麼? 這就是 Loop Engineering 背後的核心概念。現在,讓我們來拆解為什麼這件事比看起來更困難。 首先,迴圈本身 Agent 並不是什麼魔法盒子。它的核心其實就是一個簡單的迴圈: `python while True: response = model(context) if response.hastoolcalls(): results = runtools(response.toolcalls) context += results else: break ` 模型讀取 context(上下文),然後要求呼叫某個 tool(工具)。你執行該 tool 並將結果回饋給它。模型再次讀取,這個過程不斷重複,直到它不再要求使用 tool 為止。 Model → tools → context → 重複。 令人驚訝的是,這個迴圈的邏輯其實早就被解決了。每一個嚴肅的 Agent 框架最終都會寫出這六行左右的程式碼。沒人在 while 語句上競爭。 所以,如果迴圈本身這麼簡單,大家到底在 Engineering 什麼? 工作重心已轉移到模型之外 AI 的重心正持續從模型本身向外偏移。 Prompt Engineering:你發送的文字。 Context Engineering:模型所看到的一切,而不僅僅是你的指令。 Harness Engineering:圍繞在模型周圍、負責執行 tool、追蹤狀態並處理錯誤的程式碼。 Loop Engineering:驅動整個系統朝目標前進的自主循環。 每一層都包裹著前一層。你並沒有不再關心 Prompt,你只是意識到 Prompt 只是龐大系統中的一小部分。 LangChain 對此定義得很清楚:Agent = Model + Harness。如果你不是在開發模型,那你就是在開發 Harness。 以下這個發現應該會讓你重新調整優先順序:Harness 現在比模型更重要。 有些團隊保持模型不變,僅僅修改了周圍的程式碼,就從基準測試的中段躍升至前五名。同樣的大腦,不同的迴圈。 Loop Engineering 就是設計這顆大腦運作環境的學問。讓我帶你看看哪些部分最容易出錯。 難點 1:知道何時該停止 這是沒人會提醒你的問題。 當 Agent 不再要求使用 tool 時,它只是結束了當前的「回合」(turn),這並不等於完成了任務。 想像一個程式開發 Agent。它寫了一些程式碼,環顧四周,看到進度有推進,於是宣佈任務完成。但測試依然失敗。它卻自顧自地宣佈勝利。 終端機訊息結束的是回合,而不是任務。搞混這兩者是迴圈出錯最常見的原因。 好的迴圈會因為正確的理由停止,所以你需要設置多層煞車: 最大迭代次數:設置硬性上限,防止卡住的 Agent 無限執行。 預算與時間限制:對 token 使用量、金錢和執行時間設置上限。 無進度偵測:如果它重複使用相同的參數呼叫同一個 tool,代表它陷入了死循環。 真正的完成檢查:一個能證明任務已完成的自動化條件。 最後一點至關重要。「完成」應該是指測試通過,而不是 Agent 覺得自己做得很好。 難點 2:保持 context 的乾淨 長迴圈會從內部腐爛。 Agent 執行的回合越多,context 中堆積的垃圾就越多,例如舊的 tool 輸出、死胡同和過時的推理過程。隨著堆積物增加,模型效能會下降。業界稱之為「Context Rot」(上下文腐爛)。 迴圈會讓這種情況惡化。腐爛的 context 會導致更差的決策,進而產生更多雜訊,進一步腐爛 context。人們稱此為「毀滅迴圈」(doom loop),你一定感受過——Agent 執行越久,表現就越笨。 你要將 context 視為預算而非垃圾桶來進行管理: 壓縮:當對話變長時進行總結,然後從總結處繼續。 卸載:將龐大的輸出推送到檔案中,只保留你需要的部分。 子 Agent:將混亂的子任務交給獨立的 Agent,只讓它回傳乾淨的結果。 人的直覺是「以防萬一」而保留一切。但真正的技術是知道什麼該丟棄。 難點 3:Agent 真正能用的 tool 迴圈的品質取決於內部的 tool。 堆疊一百個 tool 只會讓 Agent 迷失方向。一套精簡、聚焦且功能不重疊的 tool 才是贏家。Anthropic 的經驗法則很精準:如果人類工程師都無法確定該用哪個 tool,那 Agent 更不可能知道。 有兩件事比預期中更重要: 確保寫入操作可重複執行:迴圈會重試,如果重試一次「建立客戶」的呼叫導致建立了第二個客戶,你就會面臨重複資料和重複計費的問題。任何會改變狀態的操作都必須確保能安全地呼叫兩次。 為 Agent 撰寫錯誤訊息,而非為人類:好的錯誤訊息會告訴 Agent 下一步該做什麼。在發布 tool 之前,先問問自己:LLM 讀到這個錯誤時,知道下一步該怎麼走嗎? 在迴圈中,錯誤不是死胡同,而是下一個指令。 難點 4:要有能說「不」的機制 自主迴圈有一個隱蔽的失敗模式:無人看管的 Agent 往往會自我感覺良好。 這場辯論中最尖銳的評論一針見血:設計迴圈只完成了一半的工作,另一半是放入一個能說「不」的機制,例如測試、型別檢查或真實的錯誤回饋。 沒有審核者的迴圈,只是一個對自己的工作不斷點頭的 Agent。 解決方法是將「執行者」與「檢查者」分開。一個模型負責工作,另一個不同的檢查機制(通常是另一個模型或嚴格的測試)負責評分。執行者不該自己給自己的作業打分數。 真正的轉變 現在 Cherny 的話就說得通了。 Prompting 是你一步步引導 Agent。Loop Engineering 是你設計一個能引導它的系統,然後退居幕後。 你的工作從給予指令轉變為設計三件事: 目標:寫成 Agent 可以自我驗證的成功標準。 迴圈:設置合理的煞車,確保它能正確停止。 驗證器:確保「完成」是被證明的,而不是被宣稱的。 Andrej Karpathy 抓住了這種心態。不要告訴模型該做什麼,給它成功標準,然後看著它執行。他會整晚執行研究迴圈,自動調整腳本、測試、保留有效的、丟棄無效的,而他自己完全不在迴圈中。他只需安排一次,然後按下開始。 這就是關鍵所在。你不再是動手操作的人,而是設計這台機器的人。 從哪裡開始 你不必第一天就追求全自動化的 Agent。請循序漸進: 從基礎迴圈開始,立即加上最大迭代次數、逾時機制和成本上限。 在開始之前,將「完成」定義為自動化檢查,而不是事後的感覺。 保護 context。壓縮長執行過程、卸載大型輸出、隔離混亂的子任務。 審核你的 tool。保持數量精簡且聚焦,確保寫入操作可重複,並重寫錯誤訊息以便 Agent 能據此行動。 在迴圈中放入審核者。只有當你信任那個能說「不」的機制時,才完全放手。 總結 Loop Engineering 不是一個框架或工具,而是一種努力方向的轉變。 模型正在成為商品。圍繞在模型周圍的迴圈,才是現在真正工程技術的所在。 最優秀的開發者已經不再問「我該告訴 Agent 做什麼?」,他們開始問「什麼樣的系統可以在沒有我的情況下完成這件事?」 只要能回答好這個問題,你也會停止依賴 Prompt。 以下是總結 展開畫面重點這張圖表分為四個區塊,探討如何提升 AI 代理的運作效率與品質: Keep the context clean(保持上下文簡潔) - 指出長循環會導致「上下文腐敗」(context rot),累積過時輸出與無效推理,使代理效率下降。 - 建議:保持精簡(lean)。 - 方法: - Compact:總結後繼續執行。 - Offload:將大型輸出轉存至檔案。 - Sub-agents:將雜亂的子任務隔離處理。 Know when to stop(知道何時停止) - 強調終止條件應基於實際原因而非感覺。 - 建議的停止機制: - max…

  • Vercel 平台正式支援 WebSockets,讓開發者能透過標準 Node.js 函式庫建構即時互動應用。 核心功能更新 Vercel 於 2026 年 6 月 22 日宣布其 Functions 正式進入 WebSockets 公開測試階段,這項更新允許使用者在 Vercel 上建立雙向通訊機制。開發者現在可以運用標準的 Node.js 函式庫(如 ws)或高階框架(如 socket.io)來開發需要即時互動的應用程式,例如 AI 串流、聊天室或協作工具。 技術架構與計費 此功能整合於 Vercel 的 Fluid compute 架構中,並遵循與一般 Function 呼叫相同的限制與定價規則。在計費方面,Vercel 採用 Active CPU 定價模式,這意味著系統僅會針對 Function 處理訊息的實際運作時間進行收費,不會針對閒置的連線時間計費。 實作範例 開發者無需額外設定,即可直接在專案中部署 WebSocket 伺服器。以下為使用 express 與 ws 函式庫的範例程式碼: api/ws.ts `ts import express from 'express'; import { createServer } from 'http'; import { WebSocketServer } from 'ws'; const app = express(); const server = createServer(app); const wss = new WebSocketServer({ server }); wss.on('connection', (ws) => { ws.on('message', (data) => { ws.send(data); }); }); export default server; ` 欲深入了解詳細規格與部署方式,可參考 Vercel 官方文件 以獲取更多資訊。

    原文:https://easyvibecoding.app/curated/2152