科技入侵现代第273章群星闪耀大模型

报错

关灯

护眼

字:

大

中

小

回目录

进书架

    第273章群星闪耀大模型 (第3/3页)

而且没有门槛，全员都能去，那是彻底疯狂了。

    今年的高考甚至有省状元对外宣称，自己要报申海交大。

    申海交大今年甚至还捞了两个IMO金牌，要知道这些原来可只会去燕大。

    这可把同城老兄弟复旦给酸死了，同济不酸，同济能去阿波罗科技，大家高度对口，本来同济也不指望能当top3。

    “大家好，我看到大家都很兴奋啊，对于能来深红实习。

    我想跟各位说，你们来深红实习，不会像在其他互联网机构那样，做一些打杂的工作，我会交给各位一个完整的项目，由深红的员工，你们看到的这十位深红员工配合大家。”

    林燃指了指会议室右边坐着的十名员工，长相明显要更加成熟一些，但也成熟不了多少。

    搞人工智能的这些工程师都很年轻。

    “由他们带着各位，做一个纯粹基于文科领域的人工智能大模型。

    需要涵盖的内容包括模拟社会学场景、分析心理学实验数据、政治政策评估、经济模型预测等等，把其限制在文科领域，需要有足够的专业度，模型在特定任务上能够达到人类专家的水平。

    这个模型我将他命名为群星闪耀。”

    啊？这还真是大家都没有想到的课题。

    这类需求在国外的话，你还能看到，但是在国内，这尼玛也太稀缺了，特定领域，仅限于文科领域的大模型，能派上什么用场？

    大家实在是想不到。

    对林燃而言，他需要的就是这种，之所以命名为群星闪耀，象征着这个模型未来放在月球背面的时候，能够照亮人类群星。

    这么说，当1971年阿美莉卡试图以一己之力脱离布雷顿森林协定的时候，人类经济学家都不知道这意味着什么的时候，群星闪耀能够给予人类指引。

    当苏俄陷入困境，在经济上艰难困苦，石油高企过去的时候，有群星闪耀能够告诉他们，到底犯了什么错。

    当华国，华国没啥问题。

    总之就是群星闪耀。

    “我可以简单和大家说一下，你们的工作可能涵盖哪些内容，如果我来做，我会从什么角度着手。

    最重要的其实是数据，数据需要聚焦于高质量、特定领域的文本，像哲学的伦理文本，形而上学的著作，社会学的理论研究和实地调查报告，政治学的政策文件、数据文本之类的。

    你要找这些，总得知道到哪里去找论文索引，知道到哪里去找开放资源，如果这些不够，要购买的话，到领域期刊去收集数据。

    开放的数据收集完，如果需要，再联系综合部去找领域期刊收购他们完整数据库的使用权。

    我预计需要确保至少500亿的tokens，来确保专业深度。

    确定数据之后要对数据进行清洗吧，要去除噪声重复以及具有偏见的内容。

    一些文本也许很热门，有超多引用或者下载，但实际上内容并无价值，这也需要大家来判断。

    这是数据阶段要做的工作，在模型开发和训练阶段，你们可以直接用深红来训练，不需要从头开发，直接让工作人员协助你们基于现有模型进行训练。

    如果训练结果不满意，需要对模型调整，那么你们可以先自己试试看，有什么不懂的，你们发邮件给我，我安排时间来为大家提出解答。

    我的目的是，希望大家能够开放出一个，足够中立客观专业的模型，外界在使用的时候，丢任何一个社会议题给它，它都能给出足够专业的解答。

    如果足够好的话，我会考虑把它卖给微博，成为微博社会议题的独立客观第三方意见。

    所以，各位，你们的工作很有意义。”

    林燃内心实际上在想，各位，不是很有意义，是非常有意义，它可能会改变整个时代的走势，改变整个世界。

    至于为什么不自己做？

    因为林燃在这个时空要呆很长一段时间，他不想专门花时间来做这个，丢给学生，在深红现有资源下，当成是一个练手的课题恰好合适。

    又不是这个暑假就要做完，会当成一个课题，一直推进，这届做不完，新一批学生进来之后继续做，本身交大的生源一年比一年好，林燃数学班的门槛也一年比一年高。

    他要在这呆七年左右，时间绰绰有余。

    “大家通过这个课题，能够接触到几乎所有的人工智能大模型需要做的工作，我相信这对各位无论是现在还是未来，都会相当有帮助。”

    最后群星闪耀上线后，在1960时空引发的影响暂且不表，在微博上，属于是直接炸粪坑了，大把博主开始指责这款大模型既不客观，也不中立，更不是什么所谓第三方，完全是林燃个人意志的体现。

    哪怕参与到其中的同学们，出来发文解释，也连带着被群起攻击。

    这是林燃也好，在座同学们也好，都始料未及的。

回目录

存书签

第273章 群星闪耀大模型

第273章群星闪耀大模型