找回密码
 会员注册
查看: 15|回复: 0

基于源码的Webpack结构分析_UTF_8

[复制链接]

2

主题

0

回帖

7

积分

新手上路

积分
7
发表于 2024-9-30 21:34:01 | 显示全部楼层 |阅读模式
分享背景即使目前优秀的构建工具层出不穷,Webpack 还是保持着其在现代前端开发工具链中不可替代的地位。这主要得益于其优秀的灵活性以及强大的生态系统。然而,随着版本更替,Webpack 的功能越来越庞大,整体的代码量日渐夸张,大大提高了学习难度。与此同时,大多数人对 Webpack 的使用都停留在配置层面,这容易陷入几个问题:想实现某个功能,但是不清楚原理,只能花大量时间调研方案。简历上写了用 Webpack 实现了 xx 功能,结果面试官连续追问直至原理。因此,深入学习 Webpack 底层原理以及架构设计是非常必要的,考虑到 Webpack 体系庞大,这边依据结构将其分为三个部分:JS 打包的核心流程Plugin 的作用与原理Loader 的作用与原理Attention:这篇分享着重在给读者梳理一个对 Webpack 完整的认知体系,并不会具体涉及到代码分割、按需加载、HMR、sourcemap、Tree-shaking 这一系列的功能实现,如果感兴趣,可以在浏览器单点搜索,学习相关的实现,后续我也会抽时间对这些重要功能逐一研究,整理一些文章出来。文中涉及大量源码,防止篇幅过长,已经做过压缩处理,同时加上了注释,方便阅读。本文会聚焦于 「JS 打包的核心流程」进行介绍,Plugin、Loader 会简单带过。「基本概念」摘自 webpack:Webpack is a module bundler. Its main purpose is to bundle JavaScript files for >usage in a browser, yet it is also capable of transforming, bundling, or >packaging just about any resource or asset.Webpack 是一个现代 JavaScript 应用程序的静态模块打包器(module bundler),它通过分析目标项目结构,找到 JavaScript 模块以及其项目中一些不能直接在浏览器运行的扩展语言(如 SCSS,TypeScript 等),并将其转换和打包为合适的格式供浏览器使用。在了解 Webpack 原理前,我们需要先了解几个核心名词的概念:入口(Entry):「构建的起点」。Webpack 从这里开始执行构建。通过 Entry 配置能够确定哪个文件作为构建过程的开始,进而识别出应用程序的「依赖图谱」。模块(Module):「构成应用的单元」。在 Webpack 的视角中,一切文件皆可视为模块,包括 JavaScript、CSS、图片或者是其他类型的文件。Webpack 从 Entry 出发,「递归」地构建出一个包含所有依赖文件的模块网络。代码块(Chunk):「代码的集合体」。Chunk 由模块合并而成,被用来优化输出文件的结构。Chunk 使得 Webpack 能够更灵活地组织和分割代码,支持代码的懒加载、拆分等高级功能。加载器(Loader):「模块的转换器」。Loader 让 Webpack 有能力去处理那些非 JavaScript 文件(Webpack 本身只理解 JavaScript)。通过 Loader,各种资源文件可以被转换为 Webpack 能够处理的模块,如将 CSS 转换为 JS 模块,或者将高版本的 JavaScript 转换为兼容性更好的形式(降级)。插件(Plugin):「构建流程的参与者」。Webpack 的构建流程中存在众多的事件钩子(hooks),Plugin 可以监听这些事件的触发,在触发时加入自定义的构建行为,如自动压缩打包后的文件、生成应用所需的 HTML 文件等。我们可以根据一个结构图来理解 Webpack 的全流程:JS 打包的核心流程在这一部分,我们会淡化 Plugin、Loader 在构建过程中的影响,大家可以把 Webpack(https://github.com/webpack/webpack)源码拉到本地,方便学习。「编译的开始」核心实现Webpack 的执行入口在 ./lib/webpack.js,我们先来看一下核心函数的实现:constwebpack=(//接收webpack配置和可选的回调函数(options,callback)=>{//根据配置创建编译器的简化版函数constcreate=()=>{letcompiler//定义编译器实例letwatch=false//是否开启观察模式的标志letwatchOptions//观察模式的配置//如果配置是数组,处理为多重编译配置//……return{compiler,watch,watchOptions};};//核心创建和运行逻辑const{compiler,watch,watchOptions}=create();if(watch){//如果开启观察模式,调用compiler.watchcompiler.watch(watchOptions,callback);}elseif(callback){//如果有回调函数,但没有开启观察模式,调用compiler.runcompiler.run(callback);}returncompiler//返回创建的编译器实例});其中,compiler.run(callback) 的执行正式开启了 Webpack 的编译过程。compiler 和 compilation在 Webpack 中,存在两个非常重要的核心对象:compiler、compilation,它们的作用如下:Compiler:Webpack 的核心,贯穿于整个构建周期。Compiler 封装了 Webpack 环境的全局配置,包括但不限于「配置信息、输出路径」等。Compilation:表示单次的构建过程及其产出。与 Compiler 不同,Compilation 对象在每次构建中都是新创建的,描述了构建的具体过程,包括模块资源、编译后的产出资源、文件的变化,以及依赖关系的状态。在watch mode 下,每当文件变化触发重新构建时,都会生成一个新的 Compilation 实例。Compiler 是一个长期存在的环境描述,贯穿整个 Webpack 运行周期;而 Compilation 是对单次构建的具体描述,每一次构建过程都可能有所不同。接下来我们主要会对 Compiler 进行深入的研究。compiler 的创建过程可以看到 compiler 是通过同一文件中的 createCompiler 创建的,我们先来看看相关的实现:constcreateCompiler=rawOptions=>{//标准化webpack配置,确保配置格式正确constoptions=getNormalizedWebpackOptions(rawOptions);//应用基本的webpack配置默认值applyWebpackOptionsBaseDefaults(options);//创建一个新的Compiler实例constcompiler=newCompiler(options.context,options);//应用Node环境相关的插件,设置基础设施日志newNodeEnvironmentPlugin({infrastructureLoggingptions.infrastructureLogging}).apply(compiler);//注册自定义插件(并不会立马执行,而是订阅相关hooks的触发)if(Array.isArray(options.plugins)){for(constpluginofoptions.plugins){if(typeofplugin==="function"){//如果插件是一个函数,直接调用并传入compilerplugin.call(compiler,compiler);}elseif(plugin){//如果插件是一个具有apply方法的对象,调用其apply方法plugin.apply(compiler);}}}//应用剩余的webpack配置默认值applyWebpackOptionsDefaults(options);//触发环境设置相关的钩子compiler.hooks.environment.call();//触发环境设置完成后的钩子compiler.hooks.afterEnvironment.call();//负责最终的配置合成与应用,注册所有内置插件newWebpackOptionsApply().process(options,compiler);//触发编译器初始化完成的钩子compiler.hooks.initialize.call();returncompiler;};从中我们可以得到这些信息:函数调用并返回了 compiler,compiler.run(callback) 的逻辑会在后面研究;函数遍历了 plugins 数组,将用户配置的 plugin 进行注册,等待后续触发,这里涉及到 Tapable 相关的知识,我会在后面进行相关介绍。函数执行 compiler.hooks 来触发相关生命周期,这个行为会使相关的 plugin 进入执行状态。WebpackOptionsApply().process 初始化同时我们可以看看 new WebpackOptionsApply().process(options, compiler); 具体做了些什么。打开 ./lib/WebpackOptionsApply.js,可以看到 WebpackOptionsApply 类中,只有一个 process 方法,代码体积非常庞大,做的主要工作就是:注册内置插件、依据 options 做初始化工作(大部分也是注册内置插件)。 可以看到,在执行 compiler.run() 之前,做了十分充足的准备工作,然后才是真正执行编译的过程,接下来我们来仔细研究一下 compiler.run() 的内容。编译阶段Compiler 的执行打开 ./lib/Compiler.js,我们直接来看看 compiler.run() 的具体实现:run(callback){//编译完成的回调constonCompiled=(err,_compilation)=>{constcompilation=_compilation;//检查是否应该输出结果if(this.hooks.shouldEmit.call(compilation)===false){//处理完成后的逻辑...return;}process.nextTick(()=>{//处理资源输出this.emitAssets(compilation,(err)=>{//其他处理逻辑...});});};//真正开始编译的逻辑construn=()=>{//调用beforeRun和run钩子this.hooks.beforeRun.callAsync(this,(err)=>{this.hooks.run.callAsync(this,(err)=>{//读取记录后开始编译this.readRecords((err)=>{this.compile(onCompiled);});});});};run();}可以看到,在整个函数实现中,触发了很多的 hooks,比如:beforeRun、run、afterDone……其中的核心就是 run 周期中的回调函数:this.compile(onCompiled);调用 「compiler.compile()」同样的套路,我们直接来看源码://启动编译流程compile(callback){constparams=this.newCompilationParams();//在编译之前调用的钩子this.hooks.beforeCompile.callAsync(params,(err)=>{//触发编译开始的钩子this.hooks.compile.call(params);//创建一个新的编译实例constcompilation=this.newCompilation(params);this.hooks.make.callAsync(compilation,(err)=>{//完成模块构建this.hooks.finishMake.callAsync(compilation,(err)=>{process.nextTick(()=>{//完成编译过程的准备工作compilation.finish((err)=>{//封闭编译记录,准备输出文件compilation.seal((err)=>{//编译完成后的钩子this.hooks.afterCompile.callAsync(compilation,(err)=>{//返回编译成功的回调returncallback(null,compilation);});});});});});});});}好家伙,回调地狱被 Webpack 玩透了,我们先整理一下钩子的执行顺序:beforeCompile - compile - make - finishMake - afterCompile(其实并不完全,比如 seal)其中核心的就是 complie 和 make 阶段。其中 complie 在函数中首先实现了 compilation 实例的创建,这一点我们不需要关心,那么接下来我们着重关注一下 make 阶段,顾名思义,这个阶段实现了整个编译过程。然而我们在代码中并没有看到回调函数中与编译相关的逻辑,由此可以想到,相关的编译逻辑应该是通过钩子触发而调用的,所以我们要在全局中搜索 compiler.hooks.make.tapAsync,通过筛选最后锁定到相关的编译逻辑在 ./lib/EntryPlugin.js 中。compiler.hooks.make.tapAsync("EntryPlugin",(compilation,callback)=>{compilation.addEntry(context,dep,options,err=>{callback(err);});});那么我们要研究一下这个插件是在哪里被注册的,通过全局搜索,发现它在 EntryOptionPlugin 中被实例化,再搜索 EntryOptionPlugin,发现在 WebpackOptionsApply 中被引入,很显然,这个插件在 compiler.run() 之前就被注册好了(一切都成了闭环~)。添加 Entry回过头来,我们再来看看 EntryPlugin 中,compilation.addEntry 都干了什么。functionaddEntry(context,entry,optionsOrName,callback){//TODOwebpack6removeconstoptions=typeofoptionsOrName==="object"optionsOrName:{nameptionsOrName};this._addEntryItem(context,entry,"dependencies",options,callback);}function_addEntryItem(context,entry,target,options,callback){const{name}=options;//尝试获取或初始化入口数据letentryData=this.entries.get(name)||this.globalEntry;//添加入口依赖entryData[target].push(entry);//检查和合并选项,这里简化为直接使用传入选项entryData.options={...entryData.options,...options};//触发添加入口的钩子this.hooks.addEntry.call(entry,options);//处理入口依赖的模块树,这里简化异步处理逻辑this.addModuleTree({context,dependency:entry},(err,module)=>{//入口添加成功this.hooks.succeedEntry.call(entry,options,module);callback(null,module);});}可以看到这里的工作就是处理 Entry,Entry 的添加过程中,会调用 addModuleTree(),依据代码的依赖关系递归构建模块树(Module Tree)添加 Module具体涉及到 addModuleTree() 及后续进程,其实就是生成 Module 的过程,为了让大家完全了解其中的内容,我们再继续看看其中的实现吧:addModuleTree({context,dependency,contextInfo},callback){//获取依赖的构造函数,并尝试从dependencyFactories中获取相应的模块工厂constDep=dependency.constructor;constmoduleFactory=this.dependencyFactories.get(Dep);//使用模块工厂创建模块,并处理模块创建后的逻辑this.handleModuleCreation({factory:moduleFactory,dependencies:[dependency],//传入的依赖作为数组originModule:null,//原始模块,这里为null,因为是入口模块contextInfo,//传入的上下文信息context//传入的上下文路径},(err,result)=>{});}handleModuleCreation({factory,dependencies,originModule,contextInfo,context,recursive=true},callback){constmoduleGraph=this.moduleGraph;constcurrentProfile=this.profilenewModuleProfile():undefined;//使用给定的工厂函数创建模块this.factorizeModule({currentProfile,factory,dependencies,originModule,contextInfo,context},(err,factoryResult)=>{constnewModule=factoryResult.module;//将新模块添加到编译过程中this.addModule(newModule,(err,module)=>{//更新模块图,设置解析后的模块和依赖this.updateModuleGraph({module,dependencies,originModule,factoryResult});//处理模块的构建和依赖关系(这里存在递归)this._handleModuleBuildAndDependencies(originModule,module,recursive,callback);});});}紧接着在 addModule 中,添加相关的 ModuleaddModule(module,callback){this.addModuleQueue.add(module,callback);}this.addModuleQueue=newAsyncQueue({name:"addModule",parent:this.processDependenciesQueue,getKeymodule)=>module.identifier(),processor:this._addModule.bind(this),});_addModule(module,callback){//将模块添加到编译过程中this._modules.set(identifier,module);this.modules.add(module);//完成模块添加,执行回调callback(null,module);}但是在这里看不到构建的内容,经过查找,发现是在 addModule 回调中的_handleModuleBuildAndDependencies() 中执行构建:_handleModuleBuildAndDependencies(originModule,module,recursive,checkCycle,callback){//构建模块this.buildModule(module,err=>{//递归处理模块依赖this.processModuleDependencies(module,err=>callback(errerr:null,module));});}buildModule(module,callback){this.buildQueue.add(module,callback);}this.buildQueue=newAsyncQueue({name:"build",parent:this.factorizeQueue,processor:this._buildModule.bind(this)});_buildModule(module,callback){//调用构建模块钩子,并添加到已构建模块集合中this.hooks.buildModule.call(module);this.builtModules.add(module);//实际进行模块构建module.build(this.options,this,this.resolverFactory.get("normal",module.resolveOptions),this.inputFileSystem,(err)=>{//将构建后的模块存储到缓存中this._modulesCache.store(module.identifier(),null,module,(err)=>{//调用构建成功钩子,并返回成功this.hooks.succeedModule.call(module);returncallback();});});}// ./lib/Module.js 抽象的build方法,定义了模块构建的接口,子类应该实现这个方法以完成具体的构建逻辑。build(options,compilation,resolver,fs,callback){constAbstractMethodError=require("./AbstractMethodError");thrownewAbstractMethodError();}//./lib/NormalModule.jsbuild(options,compilation,resolver,fs,callback){//初始化模块构建状态this.resetBuildState();//获取钩子consthooks=NormalModule.getCompilationHooks(compilation);//执行构建过程returnthis._doBuild(options,compilation,resolver,fs,hooks,(err)=>{hooks.beforeParse.call(this);//调用解析前的钩子constsource=this._source.source();//解析模块内容this.parser.parse(this._ast||source,{source,current:this,module:this,compilation:compilation,optionsptions,});handleParseResult();});}虽然代码很长,但是其中的逻辑十分顺畅,唯一要注意的是 build() 存在一个继承的问题。在 ./lib/NormalModule.js 的 build() 中,还可以看到 _doBuild():_doBuild(options,compilation,resolver,fs,hooks,callback){//调用加载器之前的钩子hooks.beforeLoaders.call(this.loaders,this,loaderContext);constprocessResult=(err,result)=>{//解析加载器返回的结果constsource=result[0];//源代码constsourceMap=result.length>=1result[1]:null;//源代码映射constextraInfo=result.length>=2result[2]:null;//额外信息//创建模块的源代码对象//……returncallback();};//执行加载器处理流程runLoaders({resource:this.resource,loaders:this.loaders,//定义如何处理资源的函数processResourceloaderContext,resourcePath,callback)=>{//...资源处理逻辑...},},(err,result)=>{//处理加载器返回的最终结果(设置模块的源码和抽象语法树AST)processResult(err,result.result);});};在这个过程中,Webpack 会使用 loader 处理 resource 并转化为 JS,将结果返回后于 processResult() 处理。Loader 处理毫无疑问,我们得看看 loader 的处理过程了。可以看到 runLoaders 即为 loader 的处理函数,从 loader-runner 包中导入:const{getContext,runLoaders}=require("loader-runner");那我们直接来看看 loader-runner 中的 loader 处理逻辑吧:exports.runLoaders=functionrunLoaders(options,callback){varloaders=options.loaders||[];varloaderContext=options.context||{};//创建loader对象loaders=loaders.map(createLoaderObject);loaderContext.loaders=loaders;//loaderContext各类配置……//迭代处理loadersiteratePitchingLoaders(processOptions,loaderContext,function(err,result){callback(null,{//……});});};functioniteratePitchingLoaders(options,loaderContext,callback){//如果已处理完所有loader,开始处理资源if(loaderContext.loaderIndex>=loaderContext.loaders.length)returnprocessResource(options,loaderContext,callback);//获取当前loadervarcurrentLoaderObject=loaderContext.loaders[loaderContext.loaderIndex];//如果当前loader的pitch方法已执行,移至下一个loaderif(currentLoaderObject.pitchExecuted){loaderContext.loaderIndex++;returniteratePitchingLoaders(options,loaderContext,callback);}//加载当前loader模块loadLoader(currentLoaderObject,function(err){varfn=currentLoaderObject.pitch;currentLoaderObject.pitchExecuted=true;//如果没有定义pitch方法,继续处理下一个loaderif(!fn)returniteratePitchingLoaders(options,loaderContext,callback);//执行pitch方法runSyncOrAsync(fn,loaderContext,[xxx],function(err){varargs=Array.prototype.slice.call(arguments,1);varhasArg=args.some(function(value){returnvalue!==undefined;});//根据pitch方法的返回值决定是继续执行下一个pitch方法,还是转向正常的loader处理流程if(hasArg){loaderContext.loaderIndex--;iterateNormalLoaders(options,loaderContext,args,callback);}else{iteratePitchingLoaders(options,loaderContext,callback);}});});}可以看到,在 loader-runner,通过迭代处理每一个 loader,在loadLoader 中检验并加载好 loader 后,在 loadLoader 的回调中执行了 fn(即 loader 的 pitch),完成了 loader 的处理。Parse 处理Parse 主要是对模块代码进行解析,构建出一个能够描述模块依赖关系的「抽象语法树」(AST)。在解析阶段,webpack 会分析代码中的 import、require 等语句,找出模块间的依赖关系,并据此构建出「模块依赖图」。这对于后续模块的合并、代码分割和 Tree Shaking 等优化操作至关重要。简单来说,Loader 的工作是「“翻译”」,Parse 的工作是「“理解”」。那么我们接下来看看 parse 是如何运作的。紧接 loader 之后,就要处理 runLoaders 中的回调函数了,在函数最后的 processResult() 中,可以看到又执行了另一个回调函数 callback(),通过回溯可以看到是在 build 中传入的。里面可以看到有一个核心逻辑:constsource=this._source.source();this.parser.parse(this._ast||source,{source,current:this,module:this,compilation:compilation,optionsptions,});parse 的主要作用其实是处理模块间的依赖关系,并将关系数据存储在module.dependencies数组中。this.parser.parse 这个函数从 ./lib/javascript/JavascriptParser.js 引入,其中 JavascriptParser 继承自 Parser,我们看看具体的实现:parse(source,state){comments=[];//初始化注释数组ast=JavascriptParser._parse(source,{sourceType:this.sourceType,//设置源码类型(模块或脚本)onComment:comments,//收集注释的回调onInsertedSemicolonpos)=>semicolons.add(pos),//收集插入的分号位置});//返回传入的状态对象returnstate;}const{Parser:AcornParser}=require("acorn");constparser=AcornParser.extend(importAssertions);_parse(code,options){ast=parser.parse(code,parserOptions);returnast;}可以看到 parse() 借助第三方库 acorn 实现了 AST 转换。对 AST 不理解的同学可以看看相关的文章:前端工程化基石 -- AST(抽象语法树)以及AST的广泛应用(https://juejin.cn/post/7155151377013047304)接下来就是打包封装模块的过程了,为了保持良好状态继续阅读,这边先用一个结构图来总结一下目前为止所有的事件进程:打包封装模块封装 Chunk在处理好 Module 之后,我们就要研究 Webpack 是如何将 Module 打为 Chunk 了。这个过程是在哪里触发的呢?可以看到,后续的执行过程中并没有相关的逻辑了,那不妨再回去看看在 this.hooks.finishMake 之后还有什么逻辑:我们看到一个单词:「seal」,有“密封”的意思,顾名思义,应该就是封装 chunk 相关的实现,查看 compilation.seal(),确实有 chunk 处理的逻辑,那么我们就再来研究一下 seal 的内容:seal(callback){//创建ChunkGraph,是模块和chunks之间关系的核心数据结构this.chunkGraph=newChunkGraph(xxx);//创建chunks的初始化Map,用于记录入口点与其直接和间接依赖的映射constchunkGraphInit=newMap();for(const[name,{dependencies,includeDependencies,options}]ofthis.entries){//为每个入口点创建一个chunkconstchunk=this.addChunk(name);//创建Entrypoint对象,并设置其对应的chunkconstentrypoint=newEntrypoint(options);entrypoint.setRuntimeChunk(chunk);entrypoint.setEntrypointChunk(chunk);//记录入口点和其关联的chunkgroupthis.namedChunkGroups.set(name,entrypoint);this.entrypoints.set(name,entrypoint);this.chunkGroups.push(entrypoint);//连接chunkgroup和chunkconnectChunkGroupAndChunk(entrypoint,chunk);//处理入口点直接和间接依赖的模块constentryModules=newSet();for(constdepof[...this.globalEntry.dependencies,...dependencies]){constmodule=this.moduleGraph.getModule(dep);if(module){//将模块与chunk和entrypoint关联起来chunkGraph.connectChunkAndEntryModule(chunk,module,entrypoint);entryModules.add(module);//记录模块到chunkGraphInit中,为后续构建chunkgraph做准备constmodulesList=chunkGraphInit.get(entrypoint)||[];modulesList.push(module);chunkGraphInit.set(entrypoint,modulesList);}}//处理包括的模块constincludedModules=[...this.mapAndSortDependencies(includeDependencies),];letmodulesList=chunkGraphInit.get(entrypoint)||[];for(constmoduleofincludedModules){modulesList.push(module);}chunkGraphInit.set(entrypoint,modulesList);}//构建chunkgraph,确定模块如何分布在chunks中buildChunkGraph(this,chunkGraphInit);this.hooks.afterChunks.call(this.chunks);//this.hooks.afterSeal.callAsync(()=>{})内容省略this.hooks.beforeChunkAssets.call();this.createChunkAssets((err)=>{cont();});callback();}seal 的内容非常多,经过压缩后,可以提炼出一个核心的处理过程:「创建 ChunkGraph」:初始化ChunkGraph实例,确定哪些模块属于哪个 chunk,以及 chunks 之间如何相互引用。「遍历入口点」:对于配置中定义的每个入口点,执行以下步骤:创建 chunk:为每个入口点创建一个新的 chunk。这个 chunk 将作为从该入口点构建出的所有模块的容器。创建并设置 Entrypoint:为每个 chunk 创建一个Entrypoint对象,确保了每个入口点都有一个对应的 chunk,且该 chunk 包含了入口点及其依赖的所有模块。处理依赖关系:将入口点的直接和间接依赖的模块与创建的 chunk 进行关联。「构建 Chunk Graph」:使用收集的信息(入口点、依赖等)构建完整的chunkGraph。「生成 Chunk Assets」:将 chunk 转换为输出的 assets,这一步会在后面进行探究。这里还有一个值得琢磨的点:代码拆分是如何实现的?chunk 都有什么类型?封装规则如何?如果详细研究,篇幅估计要难以承受,这边考虑放到后面单独起一篇文章进行研究。不过我们可以先了解最基础的两种 chunk:「Entry Chunks」规则:每个入口点(entry point)至少生成一个entry chunk。目的:确保应用或页面的入口有一个对应的chunk,包含所有必要的启动代码。配置:通过 entry 配置指定。「Async Chunks」规则:使用 import() 语句导入的模块会被封装到一个新的 async chunk 中。目的:实现代码拆分和懒加载,优化初始加载时间,按需加载额外功能。配置:无需特殊配置,Webpack 自动处理动态导入。通过 emit 将 Assets 输出那么接下来我们在聚焦于将 chunk 转换为 assets 的实现逻辑,可以看到 createChunkAssets 中的具体实现:functioncreateChunkAssets(callback){asyncLib.forEachLimit(this.chunks,15,(chunk,callback)=>{letmanifest;//获取chunk将要生成的assets的清单manifest=this.getRenderManifest({chunk,xxx});//处理manifest中的每个文件asyncLib.forEach(manifest,(fileManifest,callback)=>{//调用render方法渲染出最终的资源内容,触发renderManifest钩子source=fileManifest.render();this.emitAsset(file,source||alreadyWritten.source,assetInfo);},callback);},callback);}可以看到核心的处理过程在 render() 和 emitAsset() 中,我们先来看看 render() 中 renderManifest 触发了哪些插件运行。可见 render() 触发了对不同资源的处理,打出最终的资源内容 Source。它用于表示文件的内容及其相关的 source map 信息(如果存在),通常包含以下主要的方法和属性:source(): 返回文件内容的「字符串」表示。map(): 返回与文件内容关联的 source map。size(): 返回内容的大小。紧接着,最终 Source 被传入了 emitAsset() 中,用来将生成的资源(assets)添加到最终输出的一部分。可是观察代码,并没有最后的 emit hook 触发,那么最后的输出在哪里呢?不妨全局搜索 this.hooks.emit,发现在 compiler.emitAssets 中触发,同时 compiler.emitAssets 在 compiler.run 的 onCompiled 中被调用,可见这个操作就是一开始的 this.compile(onCompiled) 中传入的回调函数,一切又形成了闭环。那么我们来看看 compiler.emitAssets 做了些什么吧!emitAssets(compilation,callback){letoutputPath=compilation.getPath(this.outputPath,{});//负责将资源写入文件系统constemitFiles=()=>{constassets=compilation.getAssets();//获取所有准备好的资源//遍历所有资源,并写入文件系统for(const{name:file,source}ofassets){lettargetFile=file;//目标文件名consttargetPath=join(this.outputFileSystem,outputPath,targetFile);//目标路径//获取资源的内容constgetContent=()=>{returntypeofsource.buffer==="function"source.buffer():Buffer.from(source.source(),"utf8");};//获取内容并写入文件系统constcontent=getContent();this.outputFileSystem.writeFile(targetPath,content,(err)=>{if(err)returncallback(err);//如果有错误,执行回调函数compilation.emittedAssets.add(file);//标记资源已发射//可以在这里调用更多的钩子,例如assetEmitted});}};//调用emit钩子并开始写入文件this.hooks.emit.callAsync(compilation,(err)=>{if(err)returncallback(err);//如果有错误,执行回调函数mkdirp(this.outputFileSystem,outputPath,emitFiles);//确保输出目录存在,然后开始写入文件});}可以看到在 compiler.emitAssets 中执行了 mkdirp(),会根据 webpack.config.js 中的 output.path 属性输出文件至目标路径,至此,全部流程就完成了!同样的,我们再通过一个完整的结构图来回顾一下具体的核心流程:image.png一些常见问题总结Asset 和 Bundle 的区别其实可以把 Bundle 理解为 Asset 的子集。「Bundle」:主要是 JavaScript 文件,也可以包含其他类型的文件(如通过插件或 loader 生成的 CSS、HTML )。「Asset」:指构建过程中生成的任何类型的文件,包括 Bundle 本身和其他所有资源(如图片、字体、样式表等)。如何手写 Webpack 插件这需要进一步了解一下 Tapable 的内容了,目前有很多优秀的文章可以直接学习:干货!撸一个webpack插件(内含tapable详解+webpack流程)(https://juejin.cn/post/6844903713312604173)构建工具的横向对比目前流行的构建工具其实很多,我们通过一个表格来进行初步比对:不同的构建工具都有各自的优点,创建项目时,需要综合自己的需求进行选择。怎么读源码阅读源码确实是一件非常艰难且挑战耐心的事情,我将结合自身的一些经验,分享一些阅读源码的心得:调整状态、心态「自驱力」:为什么要读源码?想要什么结果?自驱力是持续学习的动力源。「好奇心、探究心」:对代码背后的逻辑、架构设计和技术决策保持好奇心,不满足于表面的了解,而是深入探究其原理和实现方式。对不懂的、不熟悉的部分保持探究心,通过查阅文档、搜索、实验和询问他人来获得理解「耐力」:读源码是一个复杂且耗时的任务,需要长时间的专注和努力。在面对难以理解的代码时,耐心地分析、逐步深入,有时也许需要多次阅读和反复实验才能获得透彻的理解。「安静」:保持安静!让自己能够深入地专注于阅读和理解代码。尤其是不要边听歌边读源码(很难专注)。掌握工具「调试源码」:尝试使用 debugger 调试代码,跟踪整个运行过程。「查阅文档」:基于一些社区资料(可以是他人的总结,也可以是官方文档……)协助源码的阅读。「结合 AI 精简源码」:可以将各种代码投喂给 AI 工具,帮代码打出注释,删除异常处理、日志等不重要的内容。「文档记录」:阅读的过程中可以同步的记录于文档,这篇文章就是一个参考,这样方便上下翻看精简后的代码,同时也能让自己的思路更加清晰。最后,我们还可以基于目标源码的特点来协助阅读。拿 Webpack 来说,虽然代码结构十分复杂,回调地狱满天飞,但是它的 hooks 机制能十分有效地帮助我们了解整体的进程,可以考虑在阅读之前,先从整体了解项目的机制,结合画图来拆解架构,大家不妨试试看!最后不得不说,Webpack 的内容实在太多了,本想控制一下篇幅,但源码的战线实在拉的太长了,尽管去除了大量无关的内容,还是让文章达到了接近 2w 的字符数。为了进一步深入 Webpack,后续还会坚持更新更多相关的内容,既然这一篇已经将整体结构梳理完了,那么后面就会考虑从一个具体的模块中进行分析,探索 Webpack 更为细节的内容实现~与此同时,对于文中不清晰或有误的地方,欢迎阅读原文评论区讨论!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-13 22:43 , Processed in 1.537387 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表