• 中/英文语义分析引擎
    自然语言处理被广泛应用于各行各业来解决关键知识性问题,例如从手机的大量珍贵的非结构化
    内容中提取得见解(CRM数据、社媒体、新闻、专利、财务信息披露等。)通过先进的算法,
    自然语言处理揭露出在非任何结构化中的人物、事件、时间、地点等内容,从而能够提供贯穿所有业务的全新层面的理解

关键词抽取

关键词提取引擎从一篇或多篇文本中提取出有代表性的关键词


实体识别

实体识别用于从文本中发现有意义的信息,例如人名、公司名、产品名、时间、地点等


信息分类

文本信息分类将文本按照预设的分类体系进行自动区分


文本聚类

相似文本聚类指的是机器人自动对给定的文本进行聚类,将语义上相似的内容归为一类
 


情感分析

情感分析指的是对文本中情感的倾向性和评价对象进行提取的过程
 


摘要抽取

在给定的字数限制范围内,摘取单篇或多篇新闻原文中的句子,来代表该篇或多篇新闻的大意和中心思想


  • 分布式智能采集引擎
    简单到只需要输入列表网址或关键词即可开始采集。不需要关心网页源码,全程鼠标操作。操作界面友好
    直观。全程智能辅助,只要你能在浏览器中可以看到的内容,几乎都可以按你需求的格式进行采集
  • 输入网址即可采集

    只需要输入采集目标的网址,即可完成采集的设置。系统会自动分析出内容页面的标题、正文、时间、作者、来源等关键事项

  • 依据内容判断文章相似度,并过滤重复

    图灵会在对采集结果文章分词的基础上,对分词结果建立索引,然后依据新的文章的分词结果快速检索到相似文章

  • 智能化辅助操作

    为了方便采集软件的使用新手,设置过程中软件会帮助用户实现一些采集设置的自动设置工作,用户只需要按提示下一步才做即可完成设置

  • 可采集结构复杂的对象集合

    智能采集是面向对象的,该对象的各项内容可以使分散在多个页面,这些内容页面可以是需要很多次链接才能到达

  • 输入关键词即可采集

    只需要输入需要采集的关键词,即可完成采集的设置。系统会自动向所有的中文搜索引擎提交这些关键词,并将搜索结果自动采集下来

  • 全程可视化鼠标操作

    全程鼠标操作,用户无需使用复杂的正则表达式技术。在绝大部分情况下,用户都不需要过问网页源码内容

  • 万能的可视化发布功能

    万能的模块发布模块,直接利用网站现有的人工发布页面,进行模拟人工发布提交。不需要再网站后台为发布编辑专门的发布接口文件

  • 强悍的抗干扰能力

    很多网站都针对采集行为作了各种干扰措施,图灵是利用仿浏览器解析技术,因此这些反采集的干扰措施对图灵基本无效

  • 武汉中科图灵科技有限公司
  •   中国·湖北省·武汉市·武昌区中南国际城A1栋1606室
  •   +86 - 027-87313836
  •   400-689-6718
  • postmaster@turing.ac.cn

关于我们

武汉中科图灵科技有限公司是一家专业的高科技术研发企业,公司专注于大数据情报服务、 学科信息资源建设、移动互联网等,面向科研院所提供完善的行业解决方案及服务!


了解更多