2024-08-13 19:00 广西科技大学数据架构师

关注

阿里巴巴-数据科学-技术面经

面试过程

SQL题目：基于如下数据为电商平台中用户每日订单金额，找出各天订单金额排名前三名的用户，表名temp1。

WITH ref_amt AS (
    SELECT
        dt,
        user_id,
        SUM(order_amt) AS order_amt_sum
    FROM temp1
    GROUP BY dt, user_id
)
SELECT
    dt,
    user_id,
    order_amt_sum,
    DENSE_RANK() OVER(PARTITION BY dt ORDER BY order_amt_sum DESC) AS drank
FROM ref_amt
WHERE drank <= 3;

SQL题目：找出连续3天及以上订单金额大于100的用户，表名temp2。

WITH ref_amt AS (
    SELECT
        user_id,
        dt,
        SUM(order_amt) AS order_amt_sum
    FROM temp2
    GROUP BY user_id, dt
),
ref_min_date AS (
    SELECT
        user_id,
        MIN(dt) AS dt_min
    FROM ref_amt
    GROUP BY user_id
),
cmb_date AS (
    SELECT
        ref_amt.user_id,
        ref_amt.dt,
        ref_min_date.dt_min,
        ref_amt.order_amt_sum,
        DATEDIFF(ref_amt.dt, ref_min_date.dt_min) AS dt_diff
    FROM ref_amt
    LEFT JOIN ref_min_date ON ref_amt.user_id = ref_min_date.user_id
)
SELECT DISTINCT user_id
FROM cmb_date
GROUP BY user_id, dt_diff
HAVING COUNT(1) >= 3;

Python题目：小明在双十一晚会上抽奖赢得了一次天猫超市免单的机会，享受在一个包裹内最大体积V，最大重量M内免单。假设商品i，体积Vi，重量Mi，库存Si，价格Pi，请你帮助小明在购物车里添置商品使得总价值最大。

class Solution:
    def maxVal(self, Vmax: int, Mmax: int, items: pd.DataFrame) -> int:
        max_val = 0
        num_items = [0] * len(items.index)
        num_items[0] = min(items.iloc[0, 2], Vmax // items.iloc[0, 0], Mmax // items.iloc[0, 1])
        max_val = num_items[0] * items.iloc[0, 3]
        for idx in range(1, len(items.index)):
            V = items.iloc[idx, 0]
            M = items.iloc[idx, 1]
            S = items.iloc[idx, 2]
            P = items.iloc[idx, 3]
            V_lft = Vmax - sum(x * y for x, y in zip(num_items, items['V']))
            M_lft = Mmax - sum(x * y for x, y in zip(num_items, items['M']))
            num_items[idx] = min(S, V_lft // V, M_lft // M)
            if sum(x * y for x, y in zip(num_items, items['P'])) > max_val:
                max_val = sum(x * y for x, y in zip(num_items, items['P']))
        return max_val

算法理论题目（选择题）：

传统机器学习：基于树的算法是传统机器学习中常用的模型，包括Random Forest (RF)，GBDT，XGBoost等。

a. 简述RF，GBDT，XGBoost三种算法的异同。
b. 分析RF、GBDT模型方差和偏差的来源和规模，并和树模型进行比较。
c. 这些结论对模型选型有什么启示。

a. 简述RF，GBDT，XGBoost三种算法的异同。
b. 分析RF、GBDT模型方差和偏差的来源和规模，并和树模型进行比较。
c. 这些结论对模型选型有什么启示。
深度学习：transformer是当今业界常用的网络结构之一，其核心是multi-head self-attention机制。

a. 描述multi-head self-attention的结构。
b. 假设数据中序列的长度为N，特征宽度为D，给出multi-head self-attention的计算复杂度。
c. 简述2种降低计算复杂度的方案。

a. 描述multi-head self-attention的结构。
b. 假设数据中序列的长度为N，特征宽度为D，给出multi-head self-attention的计算复杂度。
c. 简述2种降低计算复杂度的方案。

#软件开发笔面经#

全部评论

推荐最新楼层

广东海洋大学嵌入式软件开发

第二问没求出订单金额大于100

点赞回复分享

发布于 2024-08-19 13:10 广东

04-18 13:55

北京邮电大学 Java

字节 TikTok-Shop 后端开发一面

自我介绍实习B 平台 针对需要不断接入新模型，做了哪些优化目前接入多少模型如何控制并发，以保证不超过模型频控限制八股简单说一下 JAVA 中的垃圾回收机制算法小于 n 的最大数：给定一个数 n，如 23121；给定一组数字 A 如 {2, 4, 9}，求由 A 中元素组成的、小于 n 的最大数，如小于 23121 的最大数为 22999其他你最近了解的 ai 最新进展了解 skills 或 mcp 的概念吗OpenClaw 最近听说了吗

发面经攒人品

点赞评论收藏

分享

04-15 17:40

门头沟学院 Java

字节后端ai开发一面分享暑期实习

努力拥抱AI中…1.项目拷打2.文档处理的分片的策略3.es中存储的数据内容，es的写入具体的过程是什么？4.如果是要做个人文档对权限的匹配该如何做呢？比如飞书中对应的授权5.Mybatis中工程操作上要对主从操作有什么适配呢？6.线程池具体是如何实现复用的呢？7.线程其中也会用到start方法是如何去减少开销的呢？8.在和LLM会写什么样的提示词呢？9为什么不使用先LLM再决策的方式呢？有没有变成一个MCP的接口。为什么不用MCP接口的实现呢？10.有遇到OOM的问题吗？比如接口无响应11.比如说出现问题，项目的排查思路，如何查看full gc的情况。12.MCP 和 function calling 有什么作用呢？他们的区别是什么呢？算法：回文子串分割+一道SQL

查看11道真题和解析

点赞评论收藏

分享

04-19 13:34

北京邮电大学 Java

字节 TikTok-Shop 后端开发二面

自我介绍实习除了 Coze，了解过其他 Agent 相关框架吗？比如 LangChain、LangGraph三个系统都涉及 DAG，区别是什么Coze 的执行引擎能否支撑你的系统A 系统 利用编排实现解耦，还有没有其他提升空间2k QPS 下，MySQL 可以抗住，为什么加二级缓存相比加缓存之前，性能提升了多少B 平台 针对下游模型的 TPM、QPM 限制，如何限流处理在采用令牌桶的基础上，任务具有不同的优先级，如何处理；再增加一个租户维度（多业务），如何处理视频生成后的链路关注过吗？最终的视频是否满足预期八股为什么选择 Redis 做缓存，还有什么应用场景Redis 实现分布式锁的原理是什么...

查看16道真题和解析

点赞评论收藏

分享

04-19 12:25

门头沟学院 Java

27实习字节后端AI开发一面攒人品中

继续来分享下最近的面经~1.实习拷打2.项目拷打3.mq幂等性怎么保证？4.基于redis的pub和sub实现的动态配置中心消息丢失了怎么办？5.limit 10 offset 100006.mysql索引的数据结构，索引覆盖是什么，联合索引索引失效的情况7.为什么会索引会失效？8.http的报文包含哪些字段？手撕：寻找数组第k大元素

查看7道真题和解析

点赞评论收藏

分享

04-21 10:15

华中师范大学 Java

字节-TikTok-后端一面

自我介绍项目介绍针对项目细节展开追问，我的项目中涉及 RAG，因此这部分问得比较多，主要会围绕整体方案、检索流程、效果优化，以及为什么这样设计来展开Java 基础，主要是结合一些常见八股去问，看看基础是否扎实Synchronized 锁升级机制，一般会从对象头、偏向锁、轻量级锁、重量级锁这些点往下问，追问锁膨胀过程和不同场景下的性能差异Java 集合框架，通常会从常见集合类的特点、底层数据结构、适用场景开始问，再延伸到 ArrayList、LinkedList、HashMap、ConcurrentHashMap 等具体实现Java 垃圾回收机制，这一块问得比较系统，通常会先问怎么判断对象是否存...

查看10道真题和解析

点赞评论收藏

分享

评论

6

41

招聘动态

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你和你的mentor相处模式是__ #

3228次浏览 20人参与

# 如果公司降薪，你会跳槽吗？ #

160173次浏览 938人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

25985次浏览 320人参与

# 实习第一天，你在干什么 #

2152次浏览 14人参与

# 华为工作体验 #

322105次浏览 1409人参与

# 你会因为行情，降低找工作标准吗？ #

2419次浏览 19人参与

# 非技术2024笔面经 #

501922次浏览 5038人参与

# 机械人与华为的爱恨情仇 #

158493次浏览 1055人参与

# 0offer互助地 #

773067次浏览 4756人参与

# 你是怎么和mt相处的？ #

103032次浏览 507人参与

# 联想求职进展汇总 #

356399次浏览 2262人参与

# 运营人求职交流聚集地 #

247227次浏览 1124人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

113551次浏览 1196人参与

# 我的成功项目解析 #

531956次浏览 8611人参与

# 打工人的工作餐日常 #

97019次浏览 558人参与

# 26年哪些行业会变好/更差 #

66200次浏览 534人参与

# 蚂蚁求职进展汇总 #

170976次浏览 1291人参与

# 今年秋招还有金九银十吗 #

82770次浏览 514人参与

# 工作两年想退休了 #

271629次浏览 2048人参与

# 你总挂在第__面？ #

14766次浏览 162人参与

# 简历上如何体现你的“AI”能力？ #

20163次浏览 405人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务