阅文测开一面凉
回答的不好,只面了15min,且无代码考核,根据项目来问,项目涉及图像,一直问图像
1.自我介绍
2.项目中python处理数据的具体功能点是什么,如何实现,实现逻辑?
在这个项目中,Python 主要是用来处理频谱图的数据预处理部分,包括数据采集、图像转换、格式整理、批量生成训练数据集等操作。
具体功能上,我做了这些事情:
读取原始频谱信号数据,转换为灰度图像格式,方便后续输入模型;
批量处理数据集,比如 resize 图像、标准化像素值,统一尺寸和格式;
脚本化封装:写了 Python 脚本,支持一键批量生成训练数据和标签,并划分训练集和验证集;
数据增强处理:做了一些图像增强,比如加噪声、裁剪等,提升模型泛化能力;
最后配合 PyTorch 加载数据,做了 Dataset 类封装,用 DataLoader 提高训练效率。
整体的实现逻辑就是:原始数据 → 脚本预处理 → 图像/张量 → 模型训练输入。
3.原始数据存储在哪里的?
本地文件系统里的,主要以频谱信号的原始数据文件或图像格式文件存在,文件组织是按场景和时间段分类的,比如不同频段、采集时间,放在不同的文件夹中。
我在项目中会用 Python 脚本去遍历这些文件夹,读取 .csv、.npy 或者 .png 等格式的数据,然后统一转成模型训练需要的输入格式,比如张量或标准化后的灰度图像。
4.读取图像之后,怎么去判断异常情况?
在读取图像之后,我这边会做几步来判断有没有异常情况,主要从格式、尺寸、像素值这几个方面入手:
格式校验:先判断文件是否真的是图像,比如用 Python 的 PIL.Image.open() 或 cv2.imread() 尝试读取,如果读出来是 None 或报错,就说明图像可能损坏或不是有效格式;
尺寸检查:有些图像可能大小不一致,会影响模型训练,我会加一段逻辑去检查图像的宽高,比如不是标准的 128x128 或 256x256 的就当异常图过滤掉;
像素值判断:会检查图像是否为空图或者全黑、全白,比如判断 np.mean(image) 的值是否极端偏高或偏低,超过阈值就认为异常;
灰度值分布:我还做过统计像素分布直方图的方式,快速扫一批图看是否有明显噪声或干扰图,属于图像质量分析的一部分;
5.给你一张图片,如何让判断这张图片他是包含空白区域
想判断它是否包含空白区域(比如全白、全黑、透明、或边缘有大片空白),我可以用 Python + OpenCV 或 PIL 来处理。然后用 numpy 去判断像素值分布。如果一整块区域(比如边缘)像素值非常接近 255(白)或 0(黑),并且面积占比超过一定阈值,就可以认为这张图有明显的空白区域。
比如我会计算:
图片整体或边缘区域的平均值
或者统计像素值大于某个阈值(比如 250)的像素点占总面积的比例
如果比例超过 30%~50%,那就标记为“有空白”。
6.自动化测试平台的搭建是怎么完成的,怎么实现的,自动化平台平台是为了干什么,怎么去实现这个平台。
我们用 Python 写了测试脚本,把输入数据批量喂给模型,输出补全图像,再和原图进行对比,自动计算 PSNR、SSIM 等图像质量指标。然后我又做了一个简单的界面,用 Flask 写的,可以一键上传数据集,后台自动执行测试流程,跑完生成对比图和指标报告。
#牛客AI配图神器#这个平台主要是为了解放手动工作,让我们每次调模型结构或改参数后,都可以快速、统一地验证模型表现。同时也方便其他同学复现验证过程,不用每次都跑 notebook 或命令行。
全部评论

相关推荐

04-24 13:51
已编辑
西安电子科技大学 Java
👋个人背景:211计算机混子,代码能力一般,春招急头白脸参加央国企最后拿下这两个offer👏offer1:中广核工程公司驻陆丰仪控调试,待遇19+4,离家1800km💯offer2:张家口卷烟厂待遇未知,应该有13个(猜测),离家500km牛油们帮忙选一下,家里人不是很喜欢卷烟厂这个offer,但是蜀黍烟草局下岸了
鸿雁于飞:先说offer1:中广核工程公司驻陆丰仪控调试(待遇19+4) 中广核这艘央企大船还是很稳的,集团综合效益稳居央企前列。但你得搞清楚,这个19+4的"19"是总包,不是到手数——招聘宣传待遇里把所有能算的都算进去了,饭卡福利积分啥的全包含,有牛油分享实际到手大概打七折。试用期到手可能就四五千的水平,转正后基本工资4800左右,其余靠绩效、年终、大修费撑着。不过核电的工作环境有点"牢笼感"——核电站位置偏僻,远离繁华都市。工程公司是承包商性质,干活比业主公司累,而且大概率要经常出差,有的岗位年出差天数100天以上。最大问题是你这1800km的距离过于离谱,核电员工工作强度最小的时候一周也就回一次家,离得远回家成本高,夫妻感情和亲子关系都是现实考验。说白了:高薪是拿青春和生活换的。 再来看offer2:张家口卷烟厂(待遇约13个) 张家口卷烟厂是河北中烟下属三家卷烟厂之一,河北中烟主打的"荷花"系列连续多年位居全国高端卷烟品牌销量前列。烟草系统薪资由基本工资+绩效+年终奖构成,综合年薪普遍显著高于当地平均水平,六险二金齐全,福利拉满。有人问"13个是不是太平平无奇了"——关键张家口是四线城市,生活成本低,这13万的购买力相当于深圳的二十多万。离家500km,开车半天到家,周末回趟家完全可行,幸福感直接上两个档次。中广核的牛油说了句大实话: "哪个核电站好?永远是离家近的那个最好。" 选烟厂同理。 但是,卷烟厂的坑你得清楚: 首先卷烟厂和烟草局不一样,卷烟厂是生产操作类岗位,很多要三班倒。报考条件明确写了要能"胜任夜班工作和长时间站立工作"。一线操作工每天盯着流水线卷烟,工作内容高度重复,有入职的人描述为"食之无味弃之可惜"。有牛油直言"卷烟厂和商业性质的烟草公司不一样,前者很坑很累"。其次你家里人不是不喜欢,而是担心你这211计算机科班出身,进了烟厂干操作工,技能会快速退化,未来如果行业改革,技术壁垒不高,转行比较困难。等你干两年再跳出来,技术栈全忘干净了,回头再去敲代码,发现连应届生都卷不过。 老牛油的灵魂三问: 1. 你是更怕穷,还是更怕想家? 如果特别恋家的人跑1800km之外,第一年哭鼻子的概率高达80%。陆丰那地方偏僻单调,核电基地又远又闷,闲下来除了打游戏没啥娱乐,社交圈也窄。找个对象都费劲——牛油亲测核电站"狼多肉少"。 2. 你的代码能力有多"一般"? 如果真的一般,仪控调试和你专业匹配度不算高,这活儿主要是工程改造设计、现场实施管理、在建机组设计审查等,偏工程向而非纯软开。干两年后跳回互联网赛道,竞争力不一定有明显提升。反倒是烟厂不需要你写代码,进去就是稳定躺平。 3. 烟草局下岸这事儿会不会让你耿耿于怀? 如果烟草局是你第一志愿,烟厂只是plan B,那得想清楚:进去了可能每天看着天花板想"如果当初去了烟草局该多好",这种内耗比钱少还折磨人。如果你能接受"反正都是烟草系统,先进去再说"的心态,那倒无所谓。 一句话总结: 如果年轻想拼想闯做技术积累,中广核虽然累和远,但简历上央企核电的金字招牌确实有含金量,加上到手收入在这两个选项里确实更高,考虑到你个人经济情况和家庭状况,假如家里不需要你常回去照顾,家里有兄弟姐妹帮手分担,那先去核电待三四年,积累经验再跳槽也不失为一步棋。 如果想安稳过日子离家近当"人上人",烟厂低线生活成本加持,加上稳定的编制和福利体系,在张家***得滋润,幸福感吊打陆丰。尤其家里人是那种离不开你的,有烟厂的稳定且离家近,比任何高薪都实在。
点赞 评论 收藏
分享
04-17 23:48
西北大学 Java
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务