5个不同的LLM在问题上自信地达成一致时,平均错误率的中位数估计为4.4%。
Robin Hanson
Robin Hanson2025年8月20日
想象一下,你问了 5 个高质量、多样化的 LLM 的问题,他们都给出了相同的答案,并且似乎对自己的答案充满信心。平均而言,他们的共同答案实际上错误的可能性有多大?
3.76K