在携程的一天
早上10点到岗,晚上7点走,中间干了啥?我是旅游BG的大模型算法工程师,今天带你看点不一样的。
10:00|到公司,先看一眼模型跑得怎么样
工位上打开电脑,第一件事:登录训练平台,看看昨晚提交的视频生成任务跑完了没。
还行,没有爆显存,Loss曲线正常。
同事路过:“新模型效果咋样?”——“还在调,中午给你看demo。”
10:30|晨会,聊15分钟
旅游BU的晨会很快:对齐进度、同步卡点、确认优先级。
我上周接了个AIGC视频生成的优化任务,目标是让生成的视频转场更自然、文案更贴合目的地。今天要试一个新开源模型的效果。
mentor听完说:“先跑个AB实验,数据说话。”
11:00|写代码+调模型,沉浸式干活
今天主要干两件事:
第一件:调优图生视频的prompt工程。我们做的是海伦AIGC视频生成平台,从0到1搭建的。输入一张高质量旅游图片(携程最不缺的就是这个),输出一段带旁白、BGM的种草视频。
难点在于:开头怎么抓眼球?转场怎么丝滑?结尾怎么让人想下单?——这就需要脑洞大开。
第二件:和上下游联调。算法不是自己玩就行,得和后端对接口、和产品对需求、和运营对效果。
群里问了一句:“这个接口返回的video_url有效期多久?”后端秒回:“24小时,需要你们自己续期。”
这种沟通,每天都有。
12:30|午饭+散步,不聊工作
公司周边吃的挺多,今天跟组里几个同事去吃了碗牛肉面。
聊的话题:最近哪个模型开源了、谁家的视频生成效果最炸裂、周末去哪玩。
午休趴桌上睡半小时,下午才有状态。
14:00|BU技术分享,每周一次
今天是公司邀请的亚马逊的工程师来做线上讲座,讲他们最新的多模态模型进展。
听完提问环节,有人问:“你们的视频生成怎么控制人物一致性?”回答很实在:“目前还在探索,没有完美方案。”
在携程,技术分享不是作秀,是真学东西。国外大厂的最新paper,公司会请原作者来讲;开源模型出来了,内部社区马上有人分享测评。
15:30|继续搬砖,顺便带带实习生
下午把新模型的推理速度优化了一下,用公司提供的算力跑了几组对比实验。
携程的算法资源是真的足——各种开源/闭源模型的API,想调哪个调哪个。
实习生问我:“prompt里加‘cinematic lighting’真的有用吗?”——“你自己试试呗,跑两组对比就知道了。”
17:00|跟mentor一对一交流
公司要求每个月和mentor至少一次1v1,但我俩基本上每周都会聊。
今天聊了两个问题:
- “新模型效果还可以,但推理耗时多了200ms,要不要上?”
- “我想往多模态方向深挖,有没有合适的项目可以接?”
mentor的回答:
- “AB实验跑完看数据,用户愿意等就上。”
- “下季度有个新项目,跟视频理解相关,到时候让你来牵头。”
这就是有人带的意义——不只是帮你解决问题,更是帮你规划成长路径。
18:30|收尾,写明天TODO
整理今天的实验数据,写进共享文档。群里同步一下进度。
#携程26春招#