近期大模型非常火，相关的资料、学习培训铺天盖地。里面无疑存在大量垃圾信息。尤其是专心搞技术和学术的同学，是非常不健康，浪费大量时间，最可怕的是离真相越来越远，永远称为麻瓜。本文的初衷就是给大家一个学习材料汇总。后面随着笔者的进步，也会推出AI真相系列对LLM的理解和研究进展。

目标

大模型生态复杂，有工业界用户、个人企业用户，也有构建者。在构建者中也分三六九等。麻瓜也有追求，我们的目标是成为未来技术金字塔顶尖人物，领域的巨人，而不是仅仅作为抄袭者、使用者和跟随者。然而国内领域内充斥着谎言、吹嘘，与国外的开放、科学的学术、研究氛围背道而驰。这对我们发展是及其不利的，我们已经落后了，并且会越拉越远。接受现实，认清本质，是我们重新出发的底气。追求本质、追求底层逻辑，也追求代码实现。让我们开启奇妙的AI大语言模型之旅吧！

学习之道-怎么学（MindSet）

动手学：搭起环境跑起来。在playground上玩儿起来。有很多非常好的工具和环境，让新手也可以很容易的使用。好在现在的学术、学习氛围非常友好、开放，有大量的开源和共享的资源。我们也会给出一些不同纬度的环境、包括数据、环境、代码和模型以及服务等方面。所以Day 1，需要简单理解工具使用步骤，非常简单。我建议先从colab开始。python，ubuntu， pytorch, huggingface。后面有专门的工具篇。快速启动自己的项目。训练一个模型，启动一个github。
向高手学：站在巨人的肩膀上(精英思维，向大师看齐)。我的这个教程会一直对齐最先进的技术、工具和理念。如何找到真正的高手，也是一个技能。开始可以先抄作业，随着自己的技术的进步、动手能力、甄别能力的加强，你会自己维护一套资讯集。大模型最先进的显然在美国、在硅谷。主要工业巨人有Google、OpenAI、Anthropic, Meta、Huggingface、Tesla，学术界巨人主要包括Stanford、MIT、CMU、哈弗。我们必须聆听大师的教诲，学习他们的思想和实践。如果你打篮球，必须学乔丹，如果你学AI，必须学OpenAI。本教程就参考了国际最顶尖的学术届和工业界研究成果。并围绕AI生态框架组织起来。
快速启动，逐层深入：AI发展太快了，时不我待；现在AI的创新也是典型的脚比脑子快的策略。因此学习AI也要足够快，但注意第二个，也要对基础理论非常重视，我建议既要快速跑起来，接受不理解的不适，又要投入重要时间做基础研究，看paper，扒代码。如何做到平衡？可以用总分总的策略，一层层揭开llm的神秘面纱。搭建和实验能力非常重要。环境快速上手。
形成框架和蓝图：AI领域知识浩如烟海。为了不被淹死，首先一定要有目的性-方向很重要。架构师出身的我，在开始进入AI领域的时候，就着手搭建一套自己的蓝图。我们首先要将形成一个LLM的整体框架，有一个全貌。随着自己成长，这个蓝图也越清晰、越具体。后面我会先从llm生命周期，以及物理架构层面，构建出一个大模型AI的全景图。将技术栈进行拆分。然后对每一个模块block进行补齐。整体框架围绕Transformer、神经网络、NLP语言模型、Prompt Engineering、模型训练、AI应用几大模块；另外Python、Huggingface、数据科学、机器学习作为基础技能进行长期补充。
The Internals抓住本质：繁荣、混乱背后，却有其客观规律。AI的本质是什么？什么是大模型？大模型的能力有哪些？有哪些缺陷？这些能力、算法背后是什么？每一次新的变革解决了什么问题？创新的套路是什么？我们在学习大量的文章、视频、代码应用基础上，不断进行总结、抽象。同时参考大师的观念、思想和作品。研究失败的案例。我会专门推出AI Internals 系列专题，大胆预测，小心求证。这部分我将在AI Internals 里面进行探索。
Be passionate最后，也是最重要的就是热情和信念。虽然后知后觉，虽然背景稀碎。但能生在这个时代，可以探索人类认知、技术创新的划时代，指数级变迁。我们是生命比前辈要也会迸发出指数级的意义。作为见证者，我们不应该只作为一个看客，我们需要作为实际的推动者。中国人也应该成为这个时代的主导者。其次，只要抓住创新的本质、了解头号玩儿家的套路，抱着开放共赢的格局，我们和Yann Lecun，和ilia 和Google，OpenAI，并没有生理上的壁垒。壁垒在人心，只要用保证正确的方向，持续努力，一定是可以使命必达。当然差距是客观存在的，保证科学、智慧的方法，利用群体的力量。对技术的敬畏是必须的。我们就是要探索这个艰难之路。
Break your limit克服障碍、突破局限：如此密集的技术创新，对于每个人都是极具挑战的。我们从菜鸟开始，什么都不会，不仅要求助于导师、书籍，还要依赖网络、ChatGPT, Google. 然而随着不断的遇到、解决一个个问题完成个一个个任务，知识和技能将不会成为限制我们探索AI世界的障碍。我们将逐步脱离这些限制，包括知识、概念层面的，也包含理解，技能方面的。这部分我会作为技能进行构建包括：Python，pytorch, NN, 数学方面的如线性代数，微积分、统计学、当然还有NLP， Trancformer, GPT,等等。逐步，我们将具备AI大师的技能，思想
优化思维：有没有更好的？不断带有优化，寻找更好的方法的思想，而不是一味的跟随，优化思维，贯穿AI发展史，如每一次技术革命，每一个新的Idea，都会推翻之前的SOTA。不管是什么任务。
元学习：这是一场学习的革命，在学习的过程中不断优化、革新学习方法、学习手段，包括利用AI优化AI，元学习，将让AI和我们不断突破旧有模式，成为全新的，不受之前数据、环境限制的学习创新。比如AlfaGo 需要看大量的棋谱，AlfaZero 不需要棋谱，可以自己构建棋谱，自监督学习也是针对原有的监督学习的革命，解决了标注数据的限制。
学会类比，对比：将大模型和人类进行对比，将机器学习与人类学习和训练类比，将AI和程序对比。非常有利于理解，同时为创新埋下种子。
学会提问：提出好的问题，比回答更重要，问题能给你指明方向、认清现实和不足，同时提升自己的本质的追求和好奇心。当然，提问也遵循借力原则，建议多商商知乎，看看大家都有哪些问题。

大模型框架

大模型生命周期与框架。类似框架有很多，我先写几个，后面再迭代