求助

各位大佬,我遇到一个项目
学校领导说要将学校房间摄像头里面的视频聊天转化成文字内容,然后对文字内容进行标准打分,总结问题,得出结论。
之前学弟门都是自己把视频下载下来,然后输入到ai里面提取文字,再把提取的文字放入ai,放入评分标准,最后得出结果,在复制粘贴下来。
老师说要省去人工步骤,直接把视频放入一个系统,让系统识别文字,将标准系统,让系统进行评分建议,就不需要人工一步一步做了,系统直接一步到位。
前面语音转文字,可以用Python做,后面我实在不知道怎么办了😭😭😭,各位大佬有没有好的意见啊。
能不能做到那种把deepseek之类的东东放到系统里,然后将输入的标准和视频转换的文字,依次放入,deepseek,再输出一个结论和建议啊😭😭😭

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务