火狐体育平台网页登录
news information
EN
当前位置:
摆脱“脏苦累”数据堂智能化数据处理技术为标注行业助燃
来源:火狐体育nba直播 | 作者:火狐体育nba直播 | 发布时间 :2024-01-12 08:58:41 | 62 次浏览: | 分享到:

  人工智能技术日新月异,优质训练数据不可或缺。IDC报告称,2023年,中国人工智能基础架构市场将超过80亿美金,未来五年年复合增⻓率将达33.8%。随着人工智能的大规模落地,数据标注的市场也将迎来爆发式增长。

  传统的人工智能数据生产完全倚赖人工,人工一次性标注,一次性算法训练,导致处理数据成本高效率低,无法规模化。同时,随着应用端数据需求不断增大、复杂度逐步提升,传统的人工智能数据生产方式已无法快速响应企业研发需求。

  数据堂立足于AI行业,为持续提升人工智能数据处理技术,打造智能化数据处理工厂,2018年成立了AI实验室。该实验室聚集国内外数十位AI科学家,专注于人工智能数据智能化处理技术、多模态数据、大数据处理等方面的研究,并获得多项发明专利。

  在王大亮博士、丰强泽博士等多位专家的带领下,AI实验室研发出“基于Human-in-the-loop智能辅助标注技术”,并荣获该项技术专利。简单来说,Human-in-the-loop的核心是将人工处理的数据教给机器学习,机器将学习结果反馈给人工进行再校对,不断重复以上过程来提升准确率。

  智能数据处理技术在AI数据标注作业时,在数据准备、预处理、质检、交付等环节都能发挥作用。基于Human-in-the-loop智能辅助标注技术,数据堂提出了“智能数据柔性制造”的观点,循环迭代、逐渐增强,明显提高数据生产效率,减少人工出错率,引领国内人工智能数据处理方式变革。

  数据智能化处理技术最重要的包含预识别技术、数据预处理、数据脱敏、数据质量评估以及应用在客户端工具上,提升数据处理效率。

  l预识别:语音识别、目标检测、关键点检测、多目标跟踪、人脸检测、发音词典,可为标注工作量减少10%~30%。

  l数据预处理:数据筛选、数据去重、关键帧抽取、语音端点检测、文语对齐,为采集和筛选降低工作量50~60%。

  l数据脱敏:人脸脱敏、文本脱敏、语音特征生成、GAN数据生成。为数据交付工作量降低80~90%。

  l客户端工具:交互式抠图客户端、视频标注工具,为复杂&连续数据标注工作效率提升30%。

  2019年,北京博士后工作交流暨新设博士后站授牌仪式时,数据堂正式获批设立博士后科研工作站。这标志着数据堂在搭建高品质人才培养平台、促进企业科学技术创新方面迈上了一个新台阶。

  获批建立博士后科研工作站,数据堂将充分的利用博士后站人才产业链条的资源作用,招收和培养博士后科研人员,搭建人工智能技术人才与企业间的合作桥梁,与国内外高校以及其他博士后科研工作站建立战略合作伙伴关系。推动数据堂与高校、科研院所开展深度课题合作,夯实复合型高层次人才的培养,逐渐增强自主创造新兴事物的能力,为行业繁荣和公司发展增添无穷能量。

  数据服务行业蒸蒸日上,数据堂在人工智能数据服务领域将持续发挥标志性、导向性和创新性作用,一直在优化自身业务与技术实力,为人工智能研发技术与应用提供数据能源支持。

  上海市四川商会向伊朗捐赠20万只KN90防护口罩、2万只一次性医用口罩,总价值约50万元。

  企业有困难不用东奔西走,可以向上海市中小企业发展服务中心这个企业的娘家来倾诉,能借助上海市企业服务云这个市政府服务企业官方平台来寻求帮助。

  滴滴已在全国106个城市设置了司机防疫服务站,为坚守在服务一线的司机师傅们免费发放口罩,消毒液等防疫物资,并帮大家为车辆消毒。

上一篇:数据分析与报表生成的智能化工具 下一篇:中兴通讯研发解决数据处理云化和智能化问题精准云网方案