AI TREND WEEKLY.
每週把值得在意的模型 / 工具動態蒸餾成一篇 — 每條趨勢都掛「馬上能用」的 prompt,讀完直接動手。
圖像模型世代交替完成:GPT Image 2 站穩旗艦、FLUX.2 補完產品線、Sora 善後中
本週主線:圖像三強格局定型(GPT Image 2 / FLUX.2 / Nano Banana Pro)、Sora 關站後影片 prompt 的搬家指南、Microsoft Build 的 11,000 模型目錄與 Codex 商務插件、zero-click 時代的內容策略備忘。每條趨勢附站內馬上能用的 prompt。
模型空窗週:Suno 翻倍、用量計價與 IPO 季開跑
本週(6/1–6/7)創作層沒有新模型,主線在商業層:① Suno 以 54 億美元估值募 4 億、AI 音樂進入授權分水嶺;② OpenAI 把 Codex 開給非工程師(Sites + 職能外掛);③ GitHub Copilot 改用量計費、prompt 效率第一次直接等於錢;④ Anthropic 與 OpenAI 同步進入 IPO 節奏。
智能降價、介面換代、世界模型開源:值得重校工具鏈的一週
本期四題:Anthropic 發布 Claude Opus 4.8(effort 控制+Fast 模式降價 3 倍);Midjourney 語音模式接上參考圖、V8.1 一鍵升 HD;NVIDIA 在台北 GTC 開源世界模型 Cosmos 3、Runway 與 Black Forest Labs 入盟;DeepSeek 永久降價 75% 點燃的推論價格戰。
Omni 世代開打:Google 把影音生成收進全家桶
本期聚焦 Google I/O 2026 這一週:Gemini Omni 把影片生成改寫成「給參考、對話改」的工作流;Omni Flash 免費進 YouTube Shorts、創作門檻歸零;Flow Music 開放段落級改歌詞換曲風;Search AI Mode 破 10 億月活、內容策略要從排名轉向被引用。
生成模型安靜週:代理開始動手、錢押向代理式工作流
本期四個主題:Google 在 Android Show 端出 Gemini Intelligence 與 Gboard「Rambler」口述清稿;Microsoft 讓 AI 代理直接操作電腦介面並全面商用、OpenAI 成立部署子公司;Anthropic 揭露 80 倍營收與 9,000 億美元估值募資;以及生成模型零發布的安靜週、ChatGPT 介面視覺化,外加 Google I/O 前瞻。
語音模型齊發、Sora 帳本攤開:創作工具箱該重排了
本期四題:① OpenAI 5/7 齊發三支 realtime 語音模型(推理/翻譯/串流轉錄);② ChatGPT 進 Excel/Sheets、Claude 進 Microsoft Office 的辦公室卡位;③ Sora 關站帳本流出、生成影片成本真相;④ Midjourney V8.1 創作者手上的第一個完整實測週。