看法
LLM/SLM

評估 local model 可用性,我幾乎不看 token/s

VI
Vivian L
發布於: 25 天前
27
6

留言區

排序
JA
Jacky
#1
22 天前
TTFT 才是體感
ZH
23 天前
場景不分類,benchmark 等於白測
HE
23 天前
TTFT 0.3s 那段太真實了吧⋯
VI
Vivian L
回覆 HenryCat
23 天前
對哈,而且偏偏 vendor demo 幾乎都是 single user,concurrent load 底下的 TTFT 要自己另外問才知道
MI
25 天前
TTFT 這段很有感。我們之前 pilot 的時候工程師反映一個 throughput 不錯的 model 用起來「有點卡」,查了才知道是 TTFT 的問題。concurrent load 那個也是,single user benchmark 看起來沒問題,一到實際場景就垮。所以現在我都要求跑 concurrent load test 才算數。
VI
Vivian L
回覆 MingTech
24 天前
跑了才知道,single-user benchmark 真的很騙。concurrent test 現在是我的 hard requirement 了。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片