京东的宝子们，提一点建议

by tuolaku - opened about 22 hours ago

首先感谢你们发布JoyAI。经过我2个小时的测试，发现这个模型有一些问题，共享出来，看看是否能更好的优化解决。以下均为I2V测试的问题：

口型同步问题。
相比原版LTX2.3模型+蒸馏Lora（8步），无论是FPS=24还是FPS=25，人物对口型无论是中文还是英文，都不是很好，甚至中文口型出现了完全对不上的情况。
语音完全像生硬的朗读没有任何情绪（像机械动作），尽管我已经在提示词中描述了，小声、胆怯等词语，在原版的LTX2.3模型中表现良好。
人物面部细节缺失，按照1280x736的分辨率，人物面部光滑，但是可以在放大部分采用detail来解决，但是原版的LTX2.3在第一个阶段已经可以做到面部皮肤细节呈现。
人物表情生硬，相比原版LTX2.3。
我的建议，能否放出未蒸馏版的JoyAI，我很乐意帮助你们测试验证。
我会放上对比，供你们查看。
首先放上LTX2.3的原版视频，模型采用MXFP8未蒸馏版+蒸馏Lora（权重0.5），分辨率1280X736，10秒：