TCESA 1197-2022 人工智能 深度合成图像系统技术规范

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

ICS35.240CCSL70团体标准人工智能深度合成图像系统技术规范Artificialintelligence—Technicalspecificationfordeepsyntheticimagesystem2022-06-30发布2022-06-30实施中国电子工业标准化技术协会发布T/CESA1197—2022T/CESA1197—2022I版权保护文件版权所有归属于该标准的发布机构,除非有其他规定,否则未经许可,此发行物及其章节不得以其他形式或任何手段进行复制、再版或使用,包括电子版,影印件,或发布在互联网及内部网络等。使用许可可于发布机构获取。T/CESA1197—2022II目  次前言.....................................................................................................................................................................III1范围...................................................................................................................................................................12规范性引用文件...............................................................................................................................................13术语和定义.......................................................................................................................................................14缩略语...............................................................................................................................................................25深度合成图像系统框架...................................................................................................................................36深度合成图像系统技术要求...........................................................................................................................46.1深度合成图像系统通用要求...................................................................................................................46.2深度合成2D人像系统要求...................................................................................................................126.3深度合成3D人像系统要求...................................................................................................................196.4深度合成人像防伪检测性能要求.........................................................................................................227深度合成图像系统测试评价方法.................................................................................................................247.1深度合成图像系统通用测试.................................................................................................................247.2深度合成2D人像系统测试...................................................................................................................287.3深度合成3D人像系统测试...................................................................................................................317.4深度合成人像防伪检测方法.................................................................................................................33T/CESA1197—2022III前  言本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国电子技术标准化研究院提出。本文件由中国电子技术标准化研究院、中国电子工业标准化技术协会归口。本文件起草单位:中国电子技术标准化研究院、腾讯云计算(北京)有限责任公司、上海计算机软件技术开发中心、上海商汤智能科技有限公司、北京旷视科技有限公司、深圳市矽赫科技有限公司、四川云从天府人工智能科技有限公司、西安深信科创信息技术有限公司、美的集团(上海)有限公司、海信集团控股股份有限公司、深圳云天励飞技术股份有限公司、马上消费金融股份有限公司、西安交通大学、西北工业大学、北京百度网讯科技有限公司、京东科技信息技术有限公司、上海人工智能研究院有限公司、武汉精测电子集团股份有限公司。本文件主要起草人:董建、马珊珊、刘海涛、刘晶、樊华、刘嘉怡、许元博、周磊、汪铖杰、徐洋、杨雨泽、邰颖、罗栋豪、朱俊伟、陈敏刚、陈文捷、赵代平、高瑞声、吴庚、梅敬青、付英波、洪鹏达、洪宝璇、李军、李继伟、翟军治、蒋泽锟、脱立恒、蔡亚森、高雪松、方静、郑文先、陈斌、杨春勇、王洪斌、蔺琛皓、张磊、岳海潇、李笑如、李博、宋海涛、王资凯、张胜森。T/CESA1197—20221人工智能深度合成图像系统技术规范1范围本文件确立了深度合成图像(含视频)系统的框架,规定了系统技术要求,描述了对应的测试评价方法。本文件适用于深度合成图像系统的设计、开发、测试、评估、管理等。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T5271.29—2000信息技术词汇第29部分:人工智能语音识别与合成GB/T21023—2007中文语音识别系统通用技术规范GB/T36464.3—2018信息技术智能语音交互系统第3部分:智能客服3术语和定义GB/T5271.29—2000界定的以及下列术语和定义适用于本文件。3.1深度合成技术deepsynthesistechnology利用以深度学习、虚拟现实为代表的生成合成类算法,在制作文本、图像、音频、视频、虚拟场景等过程中合成内容的技术。注:深度合成技术应用场景包括包括语音合成、人脸再现、全身合成、数字虚拟人、虚拟现实等。3.2深度合成图像系统deepsyntheticimagesystem采用AI技术用于人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等对图像、视频中人脸等生物特征进行生成或者编辑的技术系统。注:深度合成图像系统的应用场景包括AI人像、美颜、换脸、影视动画制作等。3.3图像生成imagegeneration从现有数据集生成图像的过程。T/CESA1197—202223.4图像合成imagecomposition把来自一张图片或者不同图片的多个视觉元素前景剪切下来,粘贴到另外一张背景图片上,得到一张合成图像。注:图像生成和图形合成的区别,图像生成负责由无到有,图像合成负责从有到优。3.5语音合成speechsynthesis人工语音的生成。[来源:GB/T5271.29—2000,12.01.53]3.6深度合成2D人像deepsynthesisof2Dportraits基于深度合成技术生成的二维人像,包括图像、视频和语音。3.7深度合成3D人像deepsynthesisof3Dportraits基于深度合成技术生成的三维人像,包括图像、视频和语音。4缩略语下列缩略语适用于本文件。AI:人工智能(ArtificialIntelligence)API:应用程序编程接口(ApplicationProgrammingInterface)DS:深度合成(DeepSynthesis)EAO:平均重叠期望(Expectedaverageoverlap)FID:距离得分(FrechetInceptionDistancescore)GAN:对抗式生成网络(GenerativeAdversarialNetwork)IoU:交并比(IntersectionoverUnion)mAP:平均精确度均值(meanAveragePrecision)MIoU:平均交并比(MeanIntersectionoverUnion)NeRF:神经辐射场(NeuralRadianceFields)NLP:自然语言理解(NatureLanguageProcess)PGAN:渐进式增长生成对抗网络(ProgressiveGenerativeAdversarialNetwork)PSNR:峰值信噪比(PeakSignal-to-NoiseRatio)SDK:软件开发工具包(SoftwareDevelopmentKit)SSIM:结构相似性(StructuralSimilarityIndexMeasure)StarGAN:星型生成对抗网络(StarGenerativeAdversarialNetwork)StyleGAN:风格生成对抗网络(StyleGenerativeAdversarialNetwork)TTS:从文本到语音(TextToSpeech)VAE变分自编码器(VariationalAuto-Encoder)2D:二维(2-Dimensional)3D:三维(3-Dimensional)T/CESA1197—202235深度合成图像系统框架深度合成图像系统框架包括AI能力层、管理层和接入层,见图1。图1深度合成图像系统框架图1中各层组成模块如下:a)AI能力层:主要分为图像模块、人像模块和防伪检测模块。1)图像模块包括图像生成、图像合

1 / 39
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功