毕业设计第四天
花了整整一天,写了一个列Householder向量的生成函数。
AscendC里面的矢量计算接口只支持32B的block运算,且带mask的接口需要8x32B对齐,烦的一匹。
查到服务器上晟腾npu的型号,但是华为文档只写支持服务器/工作站产品xx型号,根本搜不到这个npu对应哪个产品,文档接口适不适配。产品页也是,找不到npu型号标注,无语死了。
除了这个列Householder向量生成 双对角化里还有5-6个差不多同一层次的函数要写。然后BDC过程更是复杂,照这个速度写不完了。
不仅要实现,还要优化。我已经加了十几个限制条件可待改进了,还是这么慢。
论文写不完的话就是延毕,被迫三方违约。前途一片黑暗。
😫
AscendC里面的矢量计算接口只支持32B的block运算,且带mask的接口需要8x32B对齐,烦的一匹。
查到服务器上晟腾npu的型号,但是华为文档只写支持服务器/工作站产品xx型号,根本搜不到这个npu对应哪个产品,文档接口适不适配。产品页也是,找不到npu型号标注,无语死了。
除了这个列Householder向量生成 双对角化里还有5-6个差不多同一层次的函数要写。然后BDC过程更是复杂,照这个速度写不完了。
不仅要实现,还要优化。我已经加了十几个限制条件可待改进了,还是这么慢。
论文写不完的话就是延毕,被迫三方违约。前途一片黑暗。
😫
全部评论
相关推荐
点赞 评论 收藏
分享
2025-12-28 16:32
重庆邮电大学 Java 程序员花海:1.技能放最后,来面试默认你都会,技能没啥用
2.实习写的看起来没啥含金量,多读读部门文档,包装下 接LLM这个没含金量 也不要用重构这种 不会给实习生做的
3.抽奖这个还是Demo项目,实际在公司里面要考虑策略,满减,触发点,触发规则 库存 之类的,不是这个项目这么简单
4.教育背景提前,格式为 教育背景 实习 项目 技能 自我评价
点赞 评论 收藏
分享

