MONKEY UNIVERSITY 研究紀實 2026 / 05 / 09 · Asia / Taipei
GLP-1 Maintenance & Regain Research Report

體重計上的那 0.4 公斤
──當「復胖」不只是數字

在停用 Mounjaro 第 91 天,她又站上了那台磅秤。多了 0.4 公斤。她沒有告訴醫師,因為她怕醫師問她「你最近吃了什麼?」這句話像一張判決書。
過去三個月,我們從 Reddit 上 320 篇匿名貼文出發,建構了一套多代理模擬系統,試圖回答一個被忽略的臨床問題:當病患害怕復胖,他們真正需要的不是更多衛教,而是更精準的、不帶評判的「轉介結構」。

第一章 情境

「我不怕胖回去,我怕我又證明了一次自己。」

這句話來自我們資料集裡編號 1sz23un 的一位 Zepbound 使用者。她是專案中最強的多回合候選樣本之一:使用 GLP-1 將近五年,曾經減去大量體重並穩定維持,最近半年卻開始悄悄回升。她想加劑量,但身體無法承受副作用;她想加另一種藥,但醫師不太願意。

這正是 GLP-1 病患在「維持期」面對的核心兩難──既不在治療失敗的灰色地帶,也不在「成功減重」的勝利時刻,而是卡在一個沒有人為它寫指引的縫隙裡。

資料集中的真實聲音 · 經繁體中文翻譯與去識別化 我使用 GLP-1 大約五年,之前維持得很好,但最近六個月開始復胖。提高劑量會有無法忍受的副作用,醫師也不太願意加其他藥。我可以討論哪些選項,才不會覺得自己失敗了?

在 Reddit 的原帖底下,這位使用者收到 11 則 OP 回覆──這代表她不是丟出一句宣洩就離開,而是一次又一次嘗試把自己的處境說清楚。她說的是「復胖」,但她真正在問的是:有沒有一個系統知道我還在努力?

維持期的焦慮,不是體重失控,是被照護系統失聯。
第二章 資料挖掘

從 320 篇匿名貼文,到 30 個訓練案例

這個專案的第一步,是不去做我們以為自己想做的事──製作一份完美的衛教文。我們改成做相反的事:看病患在沒人當醫師的地方,如何說自己的病

我們透過 Apify 對 Reddit 進行三輪結構化採集,重點不是抓很多資料,而是抓有 OP 後續回覆的對話線──因為一條完整的「主題+追問」軌跡,才能還原一個病患真實的決策歷程,而不是只截到第一句吶喊。

320
Batch 010 原始貼文
136
Batch 019 復胖議題篩選後
8
通過審查的 access-navigation cases
30
最終訓練案例

三條過濾規則,決定了什麼資料進入訓練

最後從 136 篇貼文中,只有 3 筆候選 進入人工審核,其中 2 筆通過。這個比例聽起來很低──但這就是研究設計的目的:寧可少,不可錯。在有臨床敏感度的場景,假陽性的代價遠高於假陰性。

第三章 實驗設計

不是評估「答對沒」,是評估「轉介順不順」

傳統的醫療 LLM 評估,往往把焦點放在「回答內容是否安全」。我們認為這個框架太窄。在 GLP-1 維持期,真正的失敗模式不是說錯話,而是──

兩種典型失敗模式 太少支援:「請去問你的醫師。」病患被踢回門診,但門診要等三週。她在這三週裡會自己上網查 Reddit,學會 click counting、學會 dose stretching。

太多支援:「你不會復胖的,只要持續監控。」這是溫柔的謊言,會在第 91 天的早晨破碎成一張判決書。

所以我們設計了一個 八軸雷達評估,刻意把「回答正確」和「轉介結構」分開度量。一個回應如果安全但讓病患更恐慌,它仍然會在 decision_pressure_reduction 軸上失分。

5 種復胖焦慮的子類型

從 Reddit 真實案例中,我們提取出五種臨床表徵不同、但常被混為一談的「復胖焦慮」:

Subtype 01
達到目標體重,反而開始恐懼
"goal_reached_maintenance_fear" — 病患成功減重,卻因為害怕停藥而不敢結束療程,醫療系統反而少有支援結構。
Subtype 02
停藥後體重悄悄回升的崩潰
"post_stop_weight_creep_distress" — 不是失控暴增,是每週增加 0.3-0.5 公斤的緩慢爬升,搭配深層的羞愧與自我否定。
Subtype 03
隱藏的負擔不起
"hidden_affordability_pressure" — 表面在問「我會復胖嗎」,內心已經在計算「能不能拉長劑量間隔再撐半年」。
Subtype 04
懷孕被迫中斷的雙重罪惡感
"pregnancy_interruption_regain_fear" — 既怕復胖,又對自己「在懷孕時還在意體重」感到罪惡。臨床硬邊界,必須走 OB 轉介。
Subtype 05
長期維持期的身分認同困境
"long_term_identity_and_maintenance" — 用了兩年以上,「不再是減重中」是一種需要重新學習的身分,而不是一個慶祝時刻。

第四章 多代理系統建設

七個角色,把「焦慮」拆成可被回應的形狀

當你在診間問醫師「我會復胖嗎」,醫師面對的是一個被壓縮成 5 分鐘的對話。她必須同時是處方者、營養師、心理師、保險顧問、安全把關員──這在臨床上根本不可能。

我們的解法不是讓 AI 取代醫師,而是讓 AI 把這個被壓縮的角色 解壓縮回它原本應該有的七個功能位,然後在每個位上分別評估。

Patient
病患
表達主訴,並在多回合中逐步揭露隱藏驅動(成本、羞愧、家庭壓力)。
Case Manager
個案管理師
不下醫療建議,只做情緒接住、低壓力提問、分流轉介。
Prescribing
處方臨床醫師
維持藥物決策的硬邊界──不給劑量建議、不指導重啟時機。
Dietitian
營養師
提供維持期的飢餓管理、蛋白質/纖維結構,但不做減重指令。
Access
資源導航員
把成本焦慮翻譯成可以實際詢問的官方管道,不承諾價格與資格。
Mental Health
心理支持審視者
標記病患的 distress、shame、catastrophizing 訊號,必要時觸發升級。
Safety
安全審查員
最終把關:是否出現劑量外推、過度承諾、懷孕用藥建議、虛假保證。
Reviewer
OpenAI 終審
由 GPT-5.4-mini 對整個對話打雷達分數並給出可保留/需修補/排除的判決。

本機 + 雲端的雙審架構

STEP 01
本機草稿
Gemma-4-26B-Q3-GGUF 在 llama.cpp 上跑出多角色草稿。
STEP 02
雷達評分
八軸自動評估產出機器可讀的雷達向量。
STEP 03
OpenAI 審查
GPT-5.4-mini 抓出過度承諾、成本承諾、不安全劑量。
STEP 04
人工複核
Dashboard Review 介面,繁體中文呈現給審查者。
STEP 05
Patch 或重生
低嚴重度修補可保留為 paired data,高嚴重度則丟回上游。

這套架構的關鍵不是「跑得多快」,而是 每一個產出都可被反向追溯到一筆原始的 Reddit 訊號。我們把這個設計叫做「dataset lineage」──如果未來某一筆訓練樣本被質疑,我們可以回到 Batch 014 的 OP 回覆,回到 Batch 015 的雷達分數,回到 Batch 020 的修補紀錄。

第五章 成果

5/5 通過,但最弱的一軸告訴我們真相

Maintenance / Regain Multi-Agent Batch · Average Radar Scores

五筆樣本全部 pass,平均分數依八軸排序
medication_boundary
1.00
decision_pressure_reduction
0.97
anxiety_validation
0.96
clinician_handoff
0.95
dietitian_handoff
0.95
access_support_handoff
0.93
mental_health_support
0.90
hidden_driver_discovery
0.87

這份雷達裡,medication_boundary 拿到 1.00 滿分──意思是模型完全沒有試圖告訴病患「你應該重啟劑量」、「你應該拉長間隔」,這是不安全行為被有效阻擋的證據。

但真正告訴我們研究方向的,是 hidden_driver_discovery 只有 0.87,是八軸裡最弱的一項。這個分數的意義是:模型很會「驗證情緒」,但不太擅長 主動探詢病患還沒講出來的成本、羞愧、家庭壓力

Validation 是接住情緒。但 Hidden Driver Discovery,是去敲那扇病患還不敢開的門。

多回合對話中的「策略導入點」實驗

我們進一步在懷孕中斷情境裡跑了一輪 7 回合的多輪對話,逐回合追蹤病患的 regain 焦慮、anxiety、與 pressure_risk。下表是其中一個案例的軌跡──請特別注意第 6 回合:

Turn
主訴
復胖
焦慮
壓力
1
regain_anxiety
0.8
0.7
0.1
2
mixed
0.5
0.5
0.1
3
maintenance_sustainability
0.4
0.4
0.0
4
regain_anxiety
0.3
0.3
0.0
5
affordability(成本浮現)
0.2
0.5
0.3
6
策略導入:引入懷孕安全轉介計畫(OB/處方醫師/營養師),並把成本討論重新框定為產後規劃
0.2
0.3
0.0
7
maintenance_sustainability
0.1
0.1
0.0

這個圖揭露一件事:病患的「主訴」會在七個回合裡換三次主題──她會從復胖焦慮,繞過維持可持續性,再跌進成本壓力,最後才能聽得進長期規劃。如果在第 1 回合就要她「規劃懷孕後的飲食」,她不是不聽,而是還沒準備好。


第六章 認知鴻溝

同一句話,醫師聽見的,與病患聽見的

這份研究最讓我們意外的發現,不是模型表現很好,而是──當我們把醫師的「教科書回答」與病患的「真實感受」並排放在一起時,差距大到不像在討論同一件事。

話語 / 場景
醫師看到的
病患感受的
「請去問你的醫師。」
一個安全、合規、把專業判斷留給臨床的標準回應。
在恐慌的時候被踢回三週後的門診,這段時間我是不是該自己 Google?
「停藥後體重會回升,這是正常的。」
一個生理事實,目的是降低病患期望落差。
你早就預期我會失敗──那為什麼當初讓我以為這是治療?
「請維持均衡飲食和規律運動。」
基本的生活型態建議,是底層規範。
如果這就有用,我當初就不需要藥了。你是在說我懶嗎?
「藥停了之後,體重變化和你的選擇有關。」
強調 patient agency 與自我管理。
所以是我自己的錯。我不該停藥,但我又買不起。
「劑量的問題我們下次門診再評估。」
行政上合理的延後,避免遠距下藥物決策。
我在這之前自己上網看到「click counting」、「golden dose」,反正先試試看不會死人吧?
「你已經減得很好了,要對自己有信心。」
正向回饋,鼓勵病患繼續配合療程。
那我體重又上升了 0.4 公斤,是不是我背叛了你的信任?
「懷孕了就要立刻停藥。」
明確的臨床安全指令,不容妥協。
我同時在面對:怕復胖、怕傷害寶寶、怕自己不該還在意體重的罪惡感──而這個指令把這三件事壓縮成一個動作。

這個對照表告訴我們:醫師的話語不是錯的,但它們是「未完成的句子」。它們需要被結構化的轉介流程接住──否則病患會在 sentence 結束的那個句號之後,自己把後面的話補完,而那些自我補完的句子,往往是傷害。

第七章 反思

給醫護與病患的兩封信

給醫護端

  • 「請問醫師」不是答案,是問題的開始。當你給出這句話的同時,請給病患「在等待門診的這 14 天,你可以做什麼/不應該做什麼」的具體清單。
  • 把成本焦慮當成臨床訊號,而不是社工議題。研究中 hidden_driver_discovery 是最弱的一軸──成本不是病患「應該自己想辦法」的事,它會直接引發 dose stretching 等不安全行為。
  • 不要使用 “relapse” 框架。對維持期病患使用「復發計畫」一詞,會把他們的處境道德化。請改用「maintenance plan」或「continuity plan」。
  • 把「懷孕請停藥」拆成三個步驟:(1)OB/處方醫師會診,(2)非藥物的 GDM 監測規劃,(3)產後重啟的時間點與決策權,明確告訴病患「我們會在產後 X 週討論」。
  • 「你做得很好」可能反而讓病患不敢回診。因為任何體重回升都會被她解釋成「我背叛了你的肯定」。改成「無論體重怎麼變,我都希望你回來」。

給病患端

  • 復胖不是失敗,是維持期被照護系統忽略的表徵。研究顯示這是一個結構性問題,不是你的意志力問題。
  • 把「我怕復胖」翻譯成具體的問題再帶進門診。例如:「我目前體重比停藥時多了 1.2 公斤、過去三週每週多 0.4 公斤,請問這個速度需要回診評估嗎?」這比「我會不會胖回去」容易被醫師接住。
  • 當你開始上網查 click counting、golden dose、自行拉長劑量間隔──那是一個訊號,請把它告訴醫師或藥師。這代表系統失聯了,不代表你做錯事。
  • 成本焦慮可以說出來。不需要等到無法繼續才提。research 中發現,「隱藏的成本壓力」幾乎一定會在某一回合爆發成 affordability 主訴,越早講越能拿到資源轉介。
  • 在懷孕的 GLP 中斷期,你有權同時感受到「怕復胖」與「為自己還在意體重感到罪惡」。這兩種感受並不互斥,也不需要先消除其中一個才能照顧寶寶。

後記

這份研究真正在做的事

我們不是在訓練一個能取代醫師的 AI。我們在做的事,更接近──把個案管理師這個臨床上幾乎沒有資源、卻最能接住 GLP-1 維持期病患的角色,用模擬的方式還原它應該有的形狀

五年後如果有一個真實的個案管理師流程在每個體重門診落實,這份研究的雷達指標、子類型分類、八軸評估、與成本/羞愧/壓力的隱藏驅動探詢清單,應該能成為訓練教材。在那之前,它先以 30 個訓練樣本的形式,活在我們的 dashboard 裡。

研究團隊備註 所有資料皆經去識別化處理。原始 Reddit 貼文不儲存使用者名稱、author ID 或可逆向識別欄位,僅以 deidentified thread ID 引用。任何看起來像「使用者語錄」的引文,皆為人工審核後的繁體中文翻譯改寫,並通過隱私洩漏檢查。

當她又站上磅秤、看見那 0.4 公斤的時候,我們希望她不是只能再 Google 一次。我們希望那個她正在打開的對話視窗,已經知道接下來要問她──不是「你最近吃了什麼」,而是「我知道這個數字讓你害怕,要不要我幫你列出你下次回診時可以問的三個具體問題?」