返回

第273章 群星闪耀大模型

首页
关灯
护眼
字:
上一页 回目录 下一章 进书架
    第273章 群星闪耀大模型 (第3/3页)

而且没有门槛,全员都能去,那是彻底疯狂了。

    今年的高考甚至有省状元对外宣称,自己要报申海交大。

    申海交大今年甚至还捞了两个IMO金牌,要知道这些原来可只会去燕大。

    这可把同城老兄弟复旦给酸死了,同济不酸,同济能去阿波罗科技,大家高度对口,本来同济也不指望能当top3。

    “大家好,我看到大家都很兴奋啊,对于能来深红实习。

    我想跟各位说,你们来深红实习,不会像在其他互联网机构那样,做一些打杂的工作,我会交给各位一个完整的项目,由深红的员工,你们看到的这十位深红员工配合大家。”

    林燃指了指会议室右边坐着的十名员工,长相明显要更加成熟一些,但也成熟不了多少。

    搞人工智能的这些工程师都很年轻。

    “由他们带着各位,做一个纯粹基于文科领域的人工智能大模型。

    需要涵盖的内容包括模拟社会学场景、分析心理学实验数据、政治政策评估、经济模型预测等等,把其限制在文科领域,需要有足够的专业度,模型在特定任务上能够达到人类专家的水平。

    这个模型我将他命名为群星闪耀。”

    啊?这还真是大家都没有想到的课题。

    这类需求在国外的话,你还能看到,但是在国内,这尼玛也太稀缺了,特定领域,仅限于文科领域的大模型,能派上什么用场?

    大家实在是想不到。

    对林燃而言,他需要的就是这种,之所以命名为群星闪耀,象征着这个模型未来放在月球背面的时候,能够照亮人类群星。

    这么说,当1971年阿美莉卡试图以一己之力脱离布雷顿森林协定的时候,人类经济学家都不知道这意味着什么的时候,群星闪耀能够给予人类指引。

    当苏俄陷入困境,在经济上艰难困苦,石油高企过去的时候,有群星闪耀能够告诉他们,到底犯了什么错。

    当华国,华国没啥问题。

    总之就是群星闪耀。

    “我可以简单和大家说一下,你们的工作可能涵盖哪些内容,如果我来做,我会从什么角度着手。

    最重要的其实是数据,数据需要聚焦于高质量、特定领域的文本,像哲学的伦理文本,形而上学的著作,社会学的理论研究和实地调查报告,政治学的政策文件、数据文本之类的。

    你要找这些,总得知道到哪里去找论文索引,知道到哪里去找开放资源,如果这些不够,要购买的话,到领域期刊去收集数据。

    开放的数据收集完,如果需要,再联系综合部去找领域期刊收购他们完整数据库的使用权。

    我预计需要确保至少500亿的tokens,来确保专业深度。

    确定数据之后要对数据进行清洗吧,要去除噪声重复以及具有偏见的内容。

    一些文本也许很热门,有超多引用或者下载,但实际上内容并无价值,这也需要大家来判断。

    这是数据阶段要做的工作,在模型开发和训练阶段,你们可以直接用深红来训练,不需要从头开发,直接让工作人员协助你们基于现有模型进行训练。

    如果训练结果不满意,需要对模型调整,那么你们可以先自己试试看,有什么不懂的,你们发邮件给我,我安排时间来为大家提出解答。

    我的目的是,希望大家能够开放出一个,足够中立客观专业的模型,外界在使用的时候,丢任何一个社会议题给它,它都能给出足够专业的解答。

    如果足够好的话,我会考虑把它卖给微博,成为微博社会议题的独立客观第三方意见。

    所以,各位,你们的工作很有意义。”

    林燃内心实际上在想,各位,不是很有意义,是非常有意义,它可能会改变整个时代的走势,改变整个世界。

    至于为什么不自己做?

    因为林燃在这个时空要呆很长一段时间,他不想专门花时间来做这个,丢给学生,在深红现有资源下,当成是一个练手的课题恰好合适。

    又不是这个暑假就要做完,会当成一个课题,一直推进,这届做不完,新一批学生进来之后继续做,本身交大的生源一年比一年好,林燃数学班的门槛也一年比一年高。

    他要在这呆七年左右,时间绰绰有余。

    “大家通过这个课题,能够接触到几乎所有的人工智能大模型需要做的工作,我相信这对各位无论是现在还是未来,都会相当有帮助。”

    最后群星闪耀上线后,在1960时空引发的影响暂且不表,在微博上,属于是直接炸粪坑了,大把博主开始指责这款大模型既不客观,也不中立,更不是什么所谓第三方,完全是林燃个人意志的体现。

    哪怕参与到其中的同学们,出来发文解释,也连带着被群起攻击。

    这是林燃也好,在座同学们也好,都始料未及的。
上一页 回目录 下一章 存书签