职位要求: - 对数据敏感,有较强的逻辑思维和沟通协调能力 - 具有基本的统计学基础和一定的数据挖掘和建模能力,熟悉Linux环境,熟练使用 SQL、Hive、Python、Excel等数据工具 - 具备一定的大数据的数据抓取、预处理、分析和汇报能力。基本了解常用的分类算法,如决策树、随机森林、K-means聚类等分类模型 一面面试官: 问题1.如果只有8G的内存,但是文件是50G,这个该怎么办? 问题2.对于5000个特征如何筛选出我们需要的特征? 问题3.考SQL id b c city time 1 122 ...