首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
N-gram是一种简单有效的统计语言模型,通常n采用1-3之
[单选题]
N-gram是一种简单有效的统计语言模型,通常n采用1-3之间的值,它们分别称为unigram、bigram和trigram。现有给定训练语料合计三个文档如下:
D1: John read Moby Dick
D2: Mary read a different book,
D3: She read a book by Cher
利用bigram求出句子“John read a book”的概率大约是( )
1
0.06
0.09
0.0008
查看答案及解析
添加笔记
求解答(15)
邀请回答
收藏(1468)
分享
7个回答
添加回答
91
Henryhust
2-gram公式
P(s1,s2,s3...) = P(s1)*P(s2|s1)*P(s3|s2).....
解:
john在文章开头的概率:P(john) = 1/3
P(read | John) = 1
P(a|read) = 2/3
P(book|a) = 1/2
P(尾巴|book) = 1/2, book出现两次,其中一次是在句子结尾处
P("John read a book") = 1/3 * 1 * 2/3 * 1/2 * 1/2 = 1/18 ≈ 0.06,故选择B
发表于 2019-08-30 18:44:26
回复(3)
31
无聊的咸鱼瘫
unigram,bigram,trigram,是自然语言处理(NLP)中的问题。父词条:n-gram.
unigram: 单个word
bigram: 双word
trigram:3 word
比如:
西安交通大学:
unigram 形式为:西/安/交/通/大/学
bigram形式为: 西安/安交/交通/通大/大学
trigram形式为:西安交/安交通/交通大/通大学
(来源百度百科)
发表于 2019-08-15 16:45:17
回复(1)
20
81192_J
发表于 2019-08-15 17:08:05
回复(4)
4
陈福林
bigram的语言模型:P(w1w2w3...wn)=P(w1)P(w2|w1)P(w3|w2)...P(wn|wn-1)
P(wn|wn-1)=count(wn,wn-1)/count(wn-1)
发表于 2018-12-26 13:41:32
回复(0)
2
付*君
我咋没懂题目的意思呢
发表于 2020-08-16 17:08:46
回复(0)
2
牛客828855060号
book作为结尾的概率是1/2
发表于 2020-05-05 23:18:31
回复(0)
0
睡不醒的夏不烦
<p>词袋模型的极大似然估计</p>
发表于 2020-06-10 15:42:39
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
算法工程师
数理统计
机器学习
概率统计
2019
360集团
来自:
360公司-2019校...
上传者:
小小
难度:
7条回答
1468收藏
9513浏览
热门推荐
相关试题
小支欲用积分兑换安仔娃娃。兑换的规...
360集团
智力题
评论
(24)
来自
360公司2014校招笔试卷
某人先写了n封投向不同的信,再写n...
组合数学
概率统计
概率论与数理统计
评论
(4)
两个长度为100的随机向量X和Y,...
百度
数理统计
评论
(9)
一般情况下,MELF型片式陶瓷电容...
元器件
评论
(1)
如果你在处理一个涉及多个不同大小、...
机器学习
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题