当前位置:新闻中心行业动态 → 正文

Github一周项目总结:Python库spaCy最热

责任编辑:editor006 作者:钰莹  |来源:企业网D1Net  2017-11-21 15:28:07 本文摘自:it168网站

过去一周,Github上最热门的项目当属自然语言处理Python库spaCy,该项目最近更新到了2.0版本。SpaCy是一个基于自然语言处理研究创建的开源项目,目的是最终将其用于真实的产品和解决方案。2.0版本增加了几个新功能,包括新的神经网络模型,支持更多的语言和改进的文档。

SpaCy的作者Matthew Honnibal在发行说明中写道,新版本通过最新的深度学习技术对spaCy进行了更新,并使得在可扩展的云计算工作流程中运行spaCy变得更加容易。

Github热门项目总结:Python库spaCy最热

新版本包含了13种神经网络模型,可用于七种以上语言。它还增加了对八种新语言(英语,德语,西班牙语,葡萄牙语,法语,意大利语,荷兰语和多语言NER)的Alpha标记化支持。它使用bloom嵌入策略来支持小表中的大型词汇表。核心神经网络模型具有词性标签,依赖标签和命名实体,小型模型将仅具有上下文特定的标记向量,而中等模型将具有词向量。

对于这个版本,大部分使用指南,API文档和代码示例都被重写了。该文档包含有关自定义处理管道,可视化工具,培训教程,单词向量和基于规则的匹配信息。现在有一个spaCy 101指南,其中包含重要概念的解释和说明以及库的特色总结。

自从一个星期前更新到2.0版以来,已经发布了2.0.3版以解决一些bug,甚至通过添加视频,更新培训提示和建议等部分来进一步更新文档。

Github上周其他五大热门项目(根据Trending排行榜得出,感兴趣可直接在Github中搜索项目名称获取详细信息):

·Git flight rules:使用Git的程序员指南。如果事情出错,开发人员可以通过该项目看看可以做什么。

·State of the art result for machine learning problems:正如名称所述,SoTA可以解决所有机器学习问题。

·Node best practices:Node.js最佳实践列表

·JS code to SVG flowchart:用于将JS代码转换成SVG流程图的可视化库。

·Tensorflow:机器学习开源软件库。

关键字:spaCyGithubPython

本文摘自:it168网站

x Github一周项目总结:Python库spaCy最热 扫一扫
分享本文到朋友圈
当前位置:新闻中心行业动态 → 正文

Github一周项目总结:Python库spaCy最热

责任编辑:editor006 作者:钰莹  |来源:企业网D1Net  2017-11-21 15:28:07 本文摘自:it168网站

过去一周,Github上最热门的项目当属自然语言处理Python库spaCy,该项目最近更新到了2.0版本。SpaCy是一个基于自然语言处理研究创建的开源项目,目的是最终将其用于真实的产品和解决方案。2.0版本增加了几个新功能,包括新的神经网络模型,支持更多的语言和改进的文档。

SpaCy的作者Matthew Honnibal在发行说明中写道,新版本通过最新的深度学习技术对spaCy进行了更新,并使得在可扩展的云计算工作流程中运行spaCy变得更加容易。

Github热门项目总结:Python库spaCy最热

新版本包含了13种神经网络模型,可用于七种以上语言。它还增加了对八种新语言(英语,德语,西班牙语,葡萄牙语,法语,意大利语,荷兰语和多语言NER)的Alpha标记化支持。它使用bloom嵌入策略来支持小表中的大型词汇表。核心神经网络模型具有词性标签,依赖标签和命名实体,小型模型将仅具有上下文特定的标记向量,而中等模型将具有词向量。

对于这个版本,大部分使用指南,API文档和代码示例都被重写了。该文档包含有关自定义处理管道,可视化工具,培训教程,单词向量和基于规则的匹配信息。现在有一个spaCy 101指南,其中包含重要概念的解释和说明以及库的特色总结。

自从一个星期前更新到2.0版以来,已经发布了2.0.3版以解决一些bug,甚至通过添加视频,更新培训提示和建议等部分来进一步更新文档。

Github上周其他五大热门项目(根据Trending排行榜得出,感兴趣可直接在Github中搜索项目名称获取详细信息):

·Git flight rules:使用Git的程序员指南。如果事情出错,开发人员可以通过该项目看看可以做什么。

·State of the art result for machine learning problems:正如名称所述,SoTA可以解决所有机器学习问题。

·Node best practices:Node.js最佳实践列表

·JS code to SVG flowchart:用于将JS代码转换成SVG流程图的可视化库。

·Tensorflow:机器学习开源软件库。

关键字:spaCyGithubPython

本文摘自:it168网站

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^