在当前快速发展的AIGC产业中,其生态系统主要分为三大核心层面:基础设施层、模型层和应用层。基础设施层主要由数据资源、计算能力和模型开发训练平台构成,为整个产业提供必要的技术支撑。模型层则涵盖了从底层的通用大模型到中间层模型,以及开源社区的协作,是技术创新的核心。应用层则是AIGC技术的具体落地。它在文本、音频、图像和视频等多种模态上实现了策略生成和跨模态生成,并已在金融、法律、设计等众多行业得到了商业化应用。
然而,AIGC技术的广泛应用也带来了一系列挑战和问题。针对AIGC三个核心层面,分别有三个相对应的主要问题。一是数据源合规问题,二是算法“黑箱”带来的问题,三是数据滥用和数据泄露问题。
目前AIGC数据获得的渠道主要来源于网络爬虫、自动识别算法、数据交易以及公司自行搜索等。使用这些渠道有可能会对自然人、法人的商业秘密、隐私权、知识产权等权利造成侵犯。此时,企业需要做的是数据资产管理、数据安全评估以及数据披露等工作。
AIGC公司获取数据后,会将这些数据供给给算法模型进行处理。而算法一旦运行,就没有人能够知道它的运行逻辑以及数据处理逻辑。这样就会导致算法“黑箱”问题的产生,从而引起算法的不可解释性、算法歧视、算法偏见等一系列问题。此时AIGC企业需要做的是算法备案、算法安全评估和问题发生后的算法披露等工作。
当数据经过了模型的测试和评估,就进入了实际运用的层面。在文本生成领域,容易出现的问题包括虚假信息传播、侵犯隐私权等。此时,企业合规需要注意的是对产品进行科学伦理性审查和全链条式监管,完善数据分享范围限制以及数据分级保护的工作。
目前,国内尚未出台针对人工智能的通用性监管法律。而是通过多部法律法规衔接、不同业态分别立法的方式形成了一套初步完备的人工智能监管体系。