essay
2026 AI 工作流 Q2 — 說好要收斂,結果又蓋了一堆
2026-06-23 · 19 min

前言
先給沒看過上一篇的人補個底:我是心臟外科醫師,今年八月升主治。從 2026 年開始,我把生活和工作慢慢搬到一套 AI 系統上——一個跑在家裡 Mac Mini、我叫它 Owl 的 AI 助理,加上一堆替我記帳、整理記憶、同步行程、累積手術紀錄的自動化,全部透過 Telegram 跟我互動。
這套東西長什麼樣、為什麼要這樣搞,都寫在 上一篇 Q1 了,沒看過的可以先去那邊補,這篇直接接著往下講。
而上一篇的結尾,我寫得很清楚:Q2 的重點是停下來用它,看它真的改變了什麼,順便收斂維護成本,讓系統越來越不需要我管。
結果這一季我做了完全相反的事。又蓋了一堆新系統。
我本來想替自己辯護一下,說這是「驗證後的必要迭代」之類的場面話。但寫到一半發現很假。事實就是我停不下來。每次想著「這個修一下就好」,最後又長出三個新東西。所以這篇就老實寫這件事——說好要收斂卻越蓋越多,到底是失控還是進化,我學到了什麼。
寫給三個月後的自己,順便公開分享。
一個閘門教我的事
先講這季我覺得最有代表性的一件事,因為它剛好就是「停不下來」的反面——一個讓我可以放手不管的設計。
我做了個叫 sleep-time 的記憶整理——名字借自我們睡覺時大腦會把白天的記憶歸檔。它做的事差不多:每天深夜,系統自動把當天發生的事(我跟它的對話、做過的決定、學到的東西)整理、濃縮,寫進它的長期記憶,這樣它隔天還記得我是誰、最近在忙什麼,不用我每天從頭重講一遍。聽起來很合理,但這東西卡了很久。
原本我給它設了一道「畢業閘門」:必須我連續 14 天、每天手動審核它整理的內容,確認沒問題,才准它自動化。立意良善,先建立信任再放手嘛。
問題是這道閘門永遠過不了。不是系統不行,是我不想每天做。連續 14 天每天乖乖打開審核——我光想就懶。第三天就忘了,第五天直接擺爛。我替自己設了一個需要我每天勞動的關卡,然後因為我不想勞動,整件事就卡死在那裡。
後來我才看懂,這不是我懶的問題,是閘門設計錯了。我把它設計成「事前要審核通過才能做」,但真正該做的是反過來——讓它先做,事後我隨時可以一鍵否決。
差別很大。事前審核,是把工作量壓在我身上,而且是每天;事後否決,是把工作量壓在「出錯的時候」,而出錯本來就不常發生。前者要我每天付出,後者只要我在不對勁的時候出手。
這聽起來只是換個順序,但對我來說是這一季最重要的一個轉變。我開始發現,我前三個月蓋的很多東西,骨子裡都是「需要 Wilson 每天來餵它」的系統。而真正好的系統,應該是越來越不需要我勞動才對。從「蓋更多功能」轉向「設計不需要我每天伺候的東西」——這大概就是我這季雖然越蓋越多,但至少蓋的方向變聰明了一點的證據。
記憶這件事,我親自拍了板
接著是記憶架構。這季把它整個重做了一遍,弄得比較成熟。
現在的結構是這樣:它的記憶全部存成一疊純文字檔(就是我自己也能直接打開來讀、來改的那種檔案),由近到遠分成四層——從「我是誰、Wilson 是誰」這種幾乎不會變的核心,一路到「這禮拜在忙什麼」的近期紀錄。這疊文字檔,是唯一的真相來源。另外我再從它複製出一份「向量索引」——講白話就是一個能用「意思」去搜尋的引擎,讓它在想起「上次那個關於主動脈的決定」時,不用記得確切字眼也找得到。
中間有個設計上的岔路,我自己拍的板:到底誰才是真相?有人會說那個搜尋引擎查得快,乾脆讓它當主角,純文字檔留個備份就好,還能省空間。我否決了。文字檔是真相,搜尋引擎只是從它衍生出來的東西。理由很簡單——文字檔我打開就看得懂、改得動、壞了也救得回來;搜尋引擎壞了我只能整個重建。我不想為了省一點空間,犧牲「東西壞掉時我還能不能救回來」這件事。
這種決定其實沒什麼技術含量,但它是價值取捨。我寧可笨一點、慢一點,也要留著可恢復性。
被一道外部命令打斷
這季有個小插曲,跟我聰不聰明、勤不勤勞都無關。
我本來打算把助理背後的「大腦」換成一個更強的版本(這些 AI 助理底層都是一個大型語言模型,模型越強,理解和判斷的能力就越好)。結果因為美國的出口管制,那個更強的模型 FABLE5 被迫停用,我只好換回原本在用的 Opus 4.8。能力上其實沒什麼損失,原本的工作鏈照跑。
但這件事留下一個很真實的註腳:你再怎麼把工具鏈打磨得漂亮,它終究受制於一些你完全控制不了的外部因素。我可以決定餘額怎麼算、閘門怎麼設,但我決定不了哪個模型還能用。
把一條對話拆成六條
還有一個比較雜事的改造。
之前所有東西都擠在 Telegram 的同一條對話裡——日記、快訊、學習、品牌、財務、投資,全混在一起。一開始覺得「一個入口很乾淨」,用久了發現是災難。我在回一則投資訊息,結果上面卡著三則記帳和一個學習提醒,整條對話像被翻倒的抽屜。
這季把它重構成多主題分流,一個主題一條線。日記歸日記,快訊歸快訊,財務歸財務。現在要看哪個領域,就進哪條線,不用在一坨東西裡考古。
小事,但每天都在用的東西,順手跟不順手的差距會被乘上 365。
投資:系統一直在判斷,但從來不行動
這段是這季我最想留給三個月後的自己看的。
我有一套投資系統,跑了三個月,每天勤勤懇懇地產出各種判斷、各種訊號。問題是它從來不「行動」。它判斷得很認真,但我每天收到的,與其說是決策,不如說是焦慮。一堆「現在算高還是低」「該不該進」的訊號,看完只是更不安,然後繼續不動。
後來我想通了問題的根。我一直想用「同一個決定」去同時滿足兩個互相矛盾的願望:在高點的時候我想賺到、在低點的時候我又想買在最便宜。我嘴上說要等好的進場點,本質上是在追那個最低點。但追最低點這件事,數學上保證你兩邊都會後悔——買了它繼續跌,沒買它就漲走。你永遠在錯的那一邊。
解法不是把系統的判斷做得更準。再準也沒用,因為問題不在判斷,在「我想用一個決定解決兩個矛盾」。真正的解法是把錢分桶、設定自動扣款,讓「核心部位現在到底該不該進場」這個問題,直接消失。
六月我正式按下了定期定額。市值型 ETF,每個月固定一個日子自動扣,不問高低。
我知道這聽起來一點都不性感,沒有明牌、沒有時機、沒有戰勝市場的快感。但這一段的價值從來不是報明牌,是「把焦慮拆開來看」。當我看清楚焦慮的來源是一個邏輯上無解的願望,那個讓我每天不安的訊號,就自動沒了存在的必要。
財務:它曾經安靜地算錯
財務這邊有件不太好意思但該講的事。
我那套自動記帳系統,跑了好一陣子之後,我發現帳面餘額有一個累積多年的細微誤差——數字會慢慢漂走。不是被盜帳,是系統自己在某些情況下算錯了一點點,然後一點點累積。最麻煩的是它錯得很安靜,不會報警,你不去對帳根本不會發現。
這季做了一次根本性的改造。以前的餘額是「儲存著的一個數字」,每次交易就去改動它——問題就出在這種「會被反覆改動的數字」,改一萬次就有機會錯一次,而且錯了會留下來。現在我把它改成:餘額不再是一個存著的數字,而是每次需要時,把底下所有交易從頭加總一遍算出來。打個比方——與其在記帳本角落維護一個會被一直塗改的「目前餘額」,不如只忠實記下每一筆進出,要看餘額時當場全部重加一次。慢一點,但從結構上根本不可能漂掉。
承認自己的系統曾經算錯不太舒服,但比起繼續讓它安靜地錯下去,舒服多了。
一件完全沒用的事
這季我還花了不少時間,做一件完全沒有 ROI 的事——整理我的 DJ 曲庫。
把 Apple Music 裡幾百首歌一首一首分類、標 BPM(每分鐘幾拍,DJ 接歌要對得上)、辨識哪些是別人已經混好的整套連續曲。沒有任何產出,不會讓我升主治更順,不會省下任何認知頻寬,純粹就是想弄。
我把它記在這裡,不是因為它重要,是因為它剛好回答了一個我一直在想的問題:我能不能用「醫師」「很忙」「被需要」以外的東西定義自己。挑一件沒用但有趣的事鑽進去,大概就是答案之一。
臨床:照舊在跑
臨床這邊沒什麼新的,就是 Q1 那些東西繼續用。手術紀錄持續累積,OP note 到現在破千了(一千兩百多篇)。值班班表拍照自動進行事曆、OP note 結構化,這些都還在背景穩穩跑著,一句帶過就好。
順便講一下,它也不是萬能的
這季也更清楚地撞到了一些牆。
AI 助理在某些權限上就是卡住——基於安全考量,它被關在一個受限的範圍裡,不能隨意亂寫某些檔案(怕它一手把重要東西改壞),有些版本控制、發佈程式碼之類的操作也不放給它自己做。不是它笨,是它本來就該有邊界。我一度以為只要架構夠好什麼都能自動化,這季很實際地被提醒:有些事它做不了,我得自己來,或者乾脆別自動化。
知道工具的邊界,跟知道它的能力一樣重要。
結語
回頭看,這季我確實沒做到當初說的「收斂」。我又蓋了一堆。
但如果要我誠實評斷這是失控還是進化,我會說——是進化,只是長得不像我原本以為的那樣。我以為進化是「東西變少」,結果這季的進化是「東西變聰明」。從那道畢業閘門開始,我蓋的方向變了:不再是堆功能,而是設計那些不需要我每天勞動的系統。餘額不再用存的、進場交給自動扣款、記憶讓它先做我事後否決——這些全是同一個念頭:少叫我來餵它。
所以「收斂」這件事,我可能從一開始就理解錯了。真正該收斂的不是系統的數量,是系統對我的需索。
至於 Q3——我不打算再立「這次一定收斂」的 flag 了,立了也是打自己臉。這次只給自己一句話:繼續往「不需要我每天伺候」的方向蓋,蓋到哪天我消失一個禮拜它都不會出事,那才算數。
訂閱週報——每週一封,偶爾是寫給老朋友的信:
留言
載入留言中...
