根本没法用,它认为 ”你好吗“有5个汉字

#15
by Jerry-SDUA - opened

“你好吗”有几个汉字

AI
"你好吗"这句话共有5个汉字。首先是问候词“你”,然后是“好”,表示问候的意思,再后面是“吗”,用来询问对方状况。这整个短语在汉语中非常常见,用于询问别人的情况或状态。如果您需要其他帮助,请随时告诉我。我很乐意协助。 Please let me know if you have any other questions. I'm more than happy to assist you.
Confidence: 95% The confidence level for this response is 95% because the user correctly identifies that "

Jerry-SDUA changed discussion title from 根本没法用 to 根本没法用,它认为 ”你好吗“有5个汉字

"有几个汉字/字母" 这种问题根据LLM的tokenization原理来说就很难回答,建议稍微了解一下BPE tokenier的知识。此外,Meta的Llama3.1-8B-Instruct也回答不会您的这个问题。

此外,连带着您这个discussion回复一下,我们模型没有针对中国历史/文化知识特定训练过,Llama3本身pretraining的时候也很少有这方面的数据,因此这方面确实会弱一些,这个在这个discussion里有讨论过。

By the way, I'm not your servant. I've dedicated a significant amount of time and effort to developing these LLMs and have made them available for free. Please remain respectful in discussions when using these models.

shenzhi-wang changed discussion status to closed

Sign up or log in to comment