DaxGLM-4.5的50元1万亿套餐其实不太划算 中发帖

现在是5并发,GLM4.5上下文长度128k,最高输出96k,生成速度平均40Tokens/s,简单算一下,每天最大消耗量是: 
每天输入23,040,000Tokens
每天输出17,280,000Tokens
每个月大约消耗1,209,600,000Tokens
但这是最理想情况,也就是输入和输出都跑满、并发跑满、不间断的跑24小时,每个月也才10亿Tokens消耗。
但是事实上,日常使用每次调用的实际消耗量还不到最大值的10分之1,假设你每天工作8小时,在这8小时里,不间断的跑满5并发,模型每次接受12.8k输入和9.6k输出,那么当月消耗量大约是40,320,000 Tokens
如果按我预估的10分之1消耗量,8小时工作,官方价格的输入的成本是23.04m÷10÷330天2元=46.08元,输出成本是17.28m÷10÷3×30天×8元=138.24元
46.08+1...