包含"词性"的全部内容
基于分布式的短文本命题实体识别之----人名识别(python实现)-安全小百科

基于分布式的短文本命题实体识别之—-人名识别(python实现)

目前对中文分词精度影响最大的主要是两方面:未登录词的识别和歧义切分。据统计:未登录词中中文姓人名在文本中一般只占2%左右,但这其中高达50%以上的人名会产生切分错误。在所有的分词错误中...
admin的头像-安全小百科admin3年前
130
自然语言处理工具包spaCy介绍-安全小百科

自然语言处理工具包spaCy介绍

spaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“Industrial-Strength Natural Language Processing in Python”,是具有工业级强度的Python NLP工具包。spaCy里大量使用了 Cyt...
admin的头像-安全小百科admin3年前
30
中文分词工具jieba中的词性类型-安全小百科

中文分词工具jieba中的词性类型

jieba为自然语言语言中常用工具包,jieba具有对分词的词性进行标注的功能,词性类别如下: Ag 形语素 形容词性语素。形容词代码为 a,语素代码g前面置以A。 a 形容词 取英语形...
admin的头像-安全小百科admin3年前
140
【转】当我们在读唐诗时,我们在读什么?-安全小百科

【转】当我们在读唐诗时,我们在读什么?

前段时间随着《中国诗词大会》的热播,全国人民掀起了读唐诗的浪潮。作为一名古典诗词爱好者,我也从网上找到了一份《全唐诗》。统计了一下,一共42974首诗,顿时有了一种“天下好诗,尽入吾硬...
admin的头像-安全小百科admin3年前
0110
NLP系列之Word2Vec模型和Doc2Vec模型 - 作者:兜哥-安全小百科

NLP系列之Word2Vec模型和Doc2Vec模型 – 作者:兜哥

NLP是AI安全领域的一个重要支撑技术。本文讲介绍NLP中的Word2Vec模型和Doc2Vec模型。Word2VecWord2Vec是Google在2013年开源的一款将词表征为实数值向量的高效工具,采用的模型有CBOW(Continuous...
admin的头像-安全小百科admin3年前
0150
拒绝网络暴力!动手开发基于深度学习的网络欺凌检测模型 - 作者:mscb-安全小百科

拒绝网络暴力!动手开发基于深度学习的网络欺凌检测模型 – 作者:mscb

网络暴力,或者说网络欺凌,在互联网上实在太普遍。如果你没有受到过网络暴力,那你很有可能不是一个有多年网络使用经验的人。 网络暴力比杠精还可恶。后者只是喜欢刷存在感,如果看到他的回复...
admin的头像-安全小百科admin3年前
0190
基于Bert-NER构建特定领域的中文信息抽取框架(上) - 作者:逸立学院-安全小百科

基于Bert-NER构建特定领域的中文信息抽取框架(上) – 作者:逸立学院

知识图谱(Knowledge Graph)主要由实体、关系和属性构成,而信息抽取(Information Extraction)作为构建知识图谱最重要的一个环节,目的就是从文本当中抽取出三元组信息,包括“实体-关系-实...
admin的头像-安全小百科admin3年前
080
基于Bert-NER构建特定领域的中文信息抽取框架(上) - 作者:逸立学院-安全小百科

基于Bert-NER构建特定领域的中文信息抽取框架(上) – 作者:逸立学院

导语:知识图谱(Knowledge Graph)主要由实体、关系和属性构成,而信息抽取(Information Extraction)作为构建知识图谱最重要的一个环节,目的就是从文本当中抽取出三元组信息,包括“实体-关...
admin的头像-安全小百科admin3年前
0250
使用NLP生成个性化的Wordlist用于密码猜测爆破 - 作者:secist-安全小百科

使用NLP生成个性化的Wordlist用于密码猜测爆破 – 作者:secist

*严正声明:本文仅限于技术讨论与分享,严禁用于非法途径我编写了一个名为Rhodiola的工具,该工具可以分析目标数据(例如目标的tweets),并检测其中最常用的主题,以此来构建一个用于密码猜测/...
admin的头像-安全小百科admin3年前
0420
大型互联网企业威胁情报运营与实践思考 - 作者:美团点评安全应急响应中心-安全小百科

大型互联网企业威胁情报运营与实践思考 – 作者:美团点评安全应急响应中心

​文丨中文(e1knot)美团安全工程师,负责集团整体威胁情报与态势感知能力的建设,曾在DEFCON China、ISC等会议上分享了多个威胁情报应用的案例与方法。0x00 大规模系统下的威胁随着用户数量、...
admin的头像-安全小百科admin3年前
0130