本文分类:news发布日期:2026/6/9 4:03:45
打赏

相关文章

GritLM:用一个 LLM 既做 embedding 又做生成

问题背景 embedding 模型和生成模型一直是两条独立路线。BERT 类双向 encoder 适合做表示,decoder-only LLM 适合做生成,把 LLM 直接拿来取 hidden state 作为 embedding 一般效果不好。论文给的对照是 Llama 2 70B 用 weighted-mean pooling 在 MTEB 上…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部