近期大模型非常火,相关的资料、学习培训铺天盖地。里面无疑存在大量垃圾信息。尤其是专心搞技术和学术的同学,是非常不健康,浪费大量时间,最可怕的是离真相越来越远,永远称为麻瓜。本文的初衷就是给大家一个学习材料汇总。 后面随着笔者的进步,也会推出AI真相系列对LLM的理解和研究进展。
目标
大模型生态复杂,有工业界用户、个人企业用户,也有构建者。在构建者中也分三六九等。麻瓜也有追求,我们的目标是成为未来技术金字塔顶尖人物,领域的巨人,而不是仅仅作为抄袭者、使用者和跟随者。然而国内领域内充斥着谎言、吹嘘,与国外的开放、科学的学术、研究氛围背道而驰。这对我们发展是及其不利的,我们已经落后了,并且会越拉越远。接受现实,认清本质,是我们重新出发的底气。追求本质、追求底层逻辑,也追求代码实现。让我们开启奇妙的AI大语言模型之旅吧!
学习之道-怎么学(MindSet)
- 动手学:搭起环境跑起来。在playground上玩儿起来。 有很多非常好的工具和环境,让新手也可以很容易的使用。好在现在的学术、学习氛围非常友好、开放,有大量的开源和共享的资源。我们也会给出一些不同纬度的环境、包括数据、环境、代码和模型以及服务等方面。所以Day 1,需要简单理解工具使用步骤,非常简单。 我建议先从colab开始。python,ubuntu, pytorch, huggingface。 后面有专门的工具篇。快速启动自己的项目。训练一个模型,启动一个github。
- 向高手学:站在巨人的肩膀上(精英思维,向大师看齐)。我的这个教程会一直对齐最先进的技术、工具和理念。如何找到真正的高手,也是一个技能。开始可以先抄作业,随着自己的技术的进步、动手能力、甄别能力的加强,你会自己维护一套资讯集。大模型最先进的显然在美国、在硅谷。主要工业巨人有Google、OpenAI、Anthropic, Meta、Huggingface、Tesla, 学术界巨人主要包括Stanford、MIT、CMU、哈弗。我们必须聆听大师的教诲,学习他们的思想和实践。如果你打篮球,必须学乔丹,如果你学AI,必须学OpenAI。本教程就参考了国际最顶尖的学术届和工业界研究成果。 并围绕AI生态框架组织起来。
- 快速启动,逐层深入:AI发展太快了,时不我待;现在AI的创新也是典型的脚比脑子快的策略。因此学习AI也要足够快,但注意第二个,也要对基础理论非常重视,我建议既要快速跑起来,接受不理解的不适,又要投入重要时间做基础研究,看paper,扒代码。如何做到平衡?可以用总分总的策略,一层层揭开llm的神秘面纱。搭建和实验能力非常重要。环境快速上手。
- 形成框架和蓝图:AI领域知识浩如烟海。为了不被淹死,首先一定要有目的性-方向很重要。架构师出身的我,在开始进入AI领域的时候,就着手搭建一套自己的蓝图。我们首先要将形成一个LLM的整体框架,有一个全貌。随着自己成长,这个蓝图也越清晰、越具体。后面我会先从llm生命周期,以及物理架构层面,构建出一个大模型AI的全景图。将技术栈进行拆分。然后对每一个模块block进行补齐。整体框架围绕Transformer、神经网络、NLP语言模型、Prompt Engineering、模型训练、AI应用几大模块;另外Python、Huggingface、数据科学、机器学习作为基础技能进行长期补充。
- The Internals抓住本质:繁荣、混乱背后,却有其客观规律。AI的本质是什么? 什么是大模型?大模型的能力有哪些?有哪些缺陷?这些能力、算法背后是什么?每一次新的变革解决了什么问题?创新的套路是什么?我们在学习大量的文章、视频、代码应用基础上,不断进行总结、抽象。同时参考大师的观念、思想和作品。研究失败的案例。我会专门推出AI Internals 系列专题,大胆预测,小心求证。这部分我将在AI Internals 里面进行探索。
- Be passionate最后,也是最重要的就是热情和信念。虽然后知后觉,虽然背景稀碎。但能生在这个时代,可以探索人类认知、技术创新的划时代,指数级变迁。我们是生命比前辈要也会迸发出指数级的意义。作为见证者,我们不应该只作为一个看客,我们需要作为实际的推动者。中国人也应该成为这个时代的主导者。 其次,只要抓住创新的本质、了解头号玩儿家的套路,抱着开放共赢的格局,我们和Yann Lecun,和ilia 和Google,OpenAI,并没有生理上的壁垒。壁垒在人心,只要用保证正确的方向,持续努力,一定是可以使命必达。当然差距是客观存在的,保证科学、智慧的方法,利用群体的力量。对技术的敬畏是必须的。我们就是要探索这个艰难之路。
- Break your limit克服障碍、突破局限:如此密集的技术创新,对于每个人都是极具挑战的。我们从菜鸟开始,什么都不会,不仅要求助于导师、书籍,还要依赖网络、ChatGPT, Google. 然而随着不断的遇到、解决一个个问题完成个一个个任务,知识和技能将不会成为限制我们探索AI世界的障碍。我们将逐步脱离这些限制,包括知识、概念层面的,也包含理解,技能方面的。这部分我会作为技能进行构建包括:Python,pytorch, NN, 数学方面的如线性代数,微积分、统计学、当然还有NLP, Trancformer, GPT,等等。逐步,我们将具备AI大师的技能,思想
- 优化思维:有没有更好的?不断带有优化,寻找更好的方法的思想,而不是一味的跟随,优化思维,贯穿AI发展史,如每一次技术革命,每一个新的Idea,都会推翻之前的SOTA。不管是什么任务。
- 元学习:这是一场学习的革命,在学习的过程中不断优化、革新学习方法、学习手段,包括利用AI优化AI,元学习,将让AI和我们不断突破旧有模式,成为全新的,不受之前数据、环境限制的学习创新。比如AlfaGo 需要看大量的棋谱,AlfaZero 不需要棋谱,可以自己构建棋谱,自监督学习也是针对原有的监督学习的革命,解决了标注数据的限制。
- 学会类比,对比:将大模型和人类进行对比,将机器学习与人类学习和训练类比,将AI和程序对比。非常有利于理解,同时为创新埋下种子。
- 学会提问:提出好的问题,比回答更重要,问题能给你指明方向、认清现实和不足,同时提升自己的本质的追求和好奇心。当然,提问也遵循借力原则,建议多商商知乎,看看大家都有哪些问题。
大模型框架
大模型生命周期与框架。类似框架有很多,我先写几个,后面再迭代