其次,要做好数据治理。
模型越大,准确率越高。大模型将AI从感知维度提升到理解维度,除了模型要合适,还需要大量的数据训练。吴文峻指出,大模型非常依赖数据,但不是从网上爬取数据后进行简单汇集就行,还要对数据进行预处理,才能更好地训练大模型。这意味着,如何打造优质的基础数据也是一个重要的问题。未来在一些领域可能会出现支撑性的模型,要想构造训练这类模型,就需要在基础数据方面做很多扎实的工作,包括共享数据、隐私保护、数据清洗、质量管理等,只有把数据治理好,才有可能打造面向不同领域的大模型。
南瑞集团南瑞研究院新技术应用研发中心副总工程师陆继翔则认为,现有预训练大模型搭配特定场景的大数据,然后经过迁移学习训练和微调,就能达到很好的效果。这就好比一个普通的足球运动员,已经具备运球和抢断等基本素质,然后再专门进行射门和抓机会等训练,就能成为一个前锋。他同时建议,要做好模型的轻量化,因为我们需要有专业的数据调用预训练好的模型,以生成更专业、更小、更细分的应用。
再次,要整合算力资源。
大模型需要强大算力支撑,根据OpenAI的研究,AI训练所需算力呈指数级增长,且增长速度将超越硬件的摩尔定律。但当前,能源电力领域的算力资源较为分散,周飞指出,国家电网公司已经建立了三大电力先进智能计算平台,但还不足以支撑类GPT算力的算法需要,因此加强整合算力资源非常必要。
除了整合自身资源,借助统一平台购买算力也是未来的可选项。2月底,国内首个一体化算力交易调度平台——东数西算一体化算力服务平台正式上线。平台整合了宁夏地区零散算力资源,以支撑国内人工智能运算平台急需的大算力服务。但业内人士提醒,由于类似的一体化算力服务平台在市场中尚无成型的标准可依,平台建设还需要解决“标准化算力接口”等问题,这也是能源行业在借助外力时需要关注的地方。
最后,要拥有开放的心态。
在人工智能与能源行业的融合过程中,打破经验主义,形成鼓励创新的机制也非常重要。忻舟认为,经验是知识的组成部分,但经验往往会局限创新能力。在推进数字技术和电力行业融合的过程中,双方都需要用更宽容的心态,形成允许试错的文化,以打破藩篱,让数实融合有更好的落地效果。
在适合的模型、专业的数据、强大的算力和开放的心态的共同作用下,我们或将看到能源科技革命和通用人工智能的融合应用。正如邬贺铨所说,我国信息化发展处于最好的历史机遇期。无论是第一次工业革命,还是第二次工业革命,都是从面向产业应用开始的,至今还服务于实体经济,以信息化为代表的第三次工业革命,则是从面向消费应用开始的。在他看来,数字技术和实体经济的融合是第三次工业革命的核心,也是新经济的内涵。数实融合之路面临很多挑战,但这条新赛道也将是网络技术以及产业发展的新机遇。