JS 模块化

JS 最初的设计是没有模块化的,仅仅是单文件裸奔。。当然之前有很多模块化的实现方法,不过目前比较流行的模块化规范是 Nodejs 中 CommonJS 的模块化( 2019 年)以及 ES6 的模块化( 2015 年)

CommonJs

模块导出

关键字:module.exports exports

moduleexports都是对象类型

最终暴露给其他模块的对象是module.exportsmodule.exports exports两者指向的内存地址是一样的(同一个引用),其实在模块加载的最开始会执行:let exports = module.exports

导出例子:

// 导出内容作为属性
module.exports.name = "js";
module.exports.foo = () => console.log("foo");
exports.abc = 123;
 
// 整体导出
module.exports = { name: "js", foo: () => {}, abc: 123 };
// exports = {name: 'js', foo: () => {}, abc: 123};  // 不可以

**注意:**整体导出只能使用module.exports,因为一旦是整体导出,是用一个对象去替换module.exports 的指向。如果用exports来整体导出,并没有改变module.exports的指向,细品上面的粗体。

模块导入

关键字:require

导入例子:require('./moduleA')

导入规则

相对路径的情况下,在导入的目录下寻找moduleA

  • 无后缀名的情况按照 JavaScript 解析
  • moduleA.json按照 json 解析
  • moduleA.node按照加载的编译插件模块 dlopen

如果同一级目录下没有moduleA文件,则会去找同级的moduleA目录

  • 如果有moduleA/package.json会找其中main指向的入口文件,如果寻找失败, fallback 到寻找下面的文件
  • moduleA/index.js
  • moduleA/index.json
  • moduleA/index.node

绝对路径的情况下,同上

没有开头路径的模块,比如vue

  • 首先判断是否是核心内置模块(比如:fs path),是就直接导入
  • 如果不是,会从当前项目中最近的node_module下找按照上面有路径的情况找文件。
  • 如果没找到 继续向父目录的node_modules中找

模块实现

Node的模块实际上可以理解为代码被包裹在一个函数包装器里面

**require wrapper: **(从知乎 (opens in a new tab)上抄的)

function wrapper(script) {
  return (
    "(function (exports, require, module, __filename, __dirname) {" +
    script +
    "\n})"
  );
}
 
function require(id) {
  var cachedModule = Module._cache[id];
  if (cachedModule) {
    return cachedModule.exports;
  }
 
  const module = { exports: {} };
 
  // 这里先将引用加入缓存
  Module._cache[id] = module;
 
  //当然不是eval这么简单
  eval(wrapper('module.exports = "123"'))(
    module.exports,
    require,
    module,
    "filename",
    "dirname"
  );
 
  return module.exports;
}

类似源码 (opens in a new tab)( TODO )的简单实现吧,主要关键是会缓存模块

  • 模块只执行一次之后调用获取的 module.exports 都是缓存,哪怕这个 js 还没执行完毕(因为先加入缓存后执行模块)
  • 模块导出就是return这个变量的其实跟a = b赋值一样(原因我认为是在导出的时候基本类型也是直接赋值拷贝的,exports.aaa = aaa), 基本类型导出的是引用类型导出的是引用地址
  • exportsmodule.exports 持有相同引用,因为最后导出的是 module.exports, 所以对exports进行赋值会导致exports操作的不再是module.exports的引用

注意这个缓存,在多次导入同一个模块的时候

  1. 会先判断是否已经缓存过这个模块(对象)
  2. 如果是没有缓存,将 module 先加入缓存**(拷贝的方式:注意引用类型)**,执行这个 module (初始化),返回module.exports对象。
  3. 总之要注意多次导入的其实是同一个缓存中的对象。

可以写一下试一试

// moduleA.js
let abc = { x: "abc" };
console.log("before: ", abc);
setTimeout(() => {
  abc.x = "bbbbbbbbxxxxx";
  console.log("after 3s: ", abc);
}, 3000);
module.exports = abc;
 
// index.js
const abc = require("./moduleA");
console.log("from index: abc", abc);
setTimeout(() => {
  console.log("after 3.5s : abc", abc);
}, 3500);
setTimeout(() => {
  const abcc = require("./moduleA");
  console.log("next require: abc", abcc);
}, 5000);

P.S. CommonJS 的模块化是动态的,运行时导入模块的对象(那一套缓存)

以及,在 CommonJS 中的this指向的就是modules.exports,情理之中,意料之外,想了想是这么回事。。

ES6 Module

参考阮一峰老师:https://es6.ruanyifeng.com/#docs/module (opens in a new tab)

ES6 模块的设计思想是尽量的静态化,使得编译时就能确定模块的依赖关系,以及输入和输出的变量。

核心:静态

使用 CommonJS 模块是运行时加载

const { resolve } = require("path");
 
// 等价于
const _path = require("path");
const resolve = _path.resolve;

ES6 编译时加载(或者静态加载)

import { resolve } from "path";

这样以来不仅效率高了,而且仅加载一个方法。 不过这也导致了没法引用 ES6 模块本身,因为它不是对象。

import.meta

MDN (opens in a new tab)

The import.meta meta-property exposes context-specific metadata to a JavaScript module. It contains information about the module, such as the module's URL.

在一些库中经常看到 import.meta.url 这样的使用,来看看他到底是个什么东西

  • 只在 es module 中存在,在非 module 场景使用会报错
  • 是环境生成的一个特殊的上下文信息对象,null-prototype,所有属性都可写、配置、可枚举
  • 通常环境会实现 urlresolve 两个属性

url

The full URL to the module, includes query parameters and/or hash (following the ? or #).

浏览器中:either the URL from which the script was obtained (for external scripts), or the URL of the containing document (for inline scripts).

nodejs 环境:是包含文件协议的路径

resolve

注意兼容性,版本很高

内置方法 (opens in a new tab),相当于直接是 path.resolve

Resolves a module specifier to a URL using the current module's URL as base.

使用场景

node 环境,commonjs 中有 __dirname 包含当前模块的绝对路径,还是很好用的,但是 esm 模式下没有,不过可以使用 import.meta.url,这个还是非常实用的,也知道了为啥之前自己用 __dirname 会报错了 XD。

Before (CommonJS):

const fs = require("fs/promises");
const path = require("path");
 
const filePath = path.join(__dirname, "someFile.txt");
fs.readFile(filePath, "utf8").then(console.log);

After (ES modules):

import fs from "node:fs/promises";
 
const fileURL = new URL("./someFile.txt", import.meta.url);
fs.readFile(fileURL, "utf8").then(console.log);

兼容性

import.meta:chrome 64,node 10

import.meta.resolve:chrome 105,node 20

__dirname

关于在 CommonJS 中的 __dirname 要怎么在 ES Module 中使用(参考 (opens in a new tab)

  1. 第一种 Node 20+ 可以直接用 import.meta.dirname
  2. 低版本就考虑 pathimport.meta 一起
import { dirname } from "path";
import { fileURLToPath } from "url";
 
const __dirname = dirname(fileURLToPath(import.meta.url));

严格模式( ES5 )

ES6 的模块自动采用严格模式

严格模式主要有以下限制。

  • 变量必须声明后再使用
  • 函数的参数不能有同名属性,否则报错
  • 不能使用with语句
  • 不能对只读属性赋值,否则报错
  • 不能使用前缀 0 表示八进制数,否则报错
  • 不能删除不可删除的属性,否则报错
  • 不能删除变量delete prop,会报错,只能删除属性delete global[prop]
  • eval不会在它的外层作用域引入变量
  • evalarguments不能被重新赋值
  • arguments不会自动反映函数参数的变化
  • 不能使用arguments.callee
  • 不能使用arguments.caller
  • 禁止this指向全局对象
  • 不能使用fn.callerfn.arguments获取函数调用的堆栈
  • 增加了保留字(比如protectedstaticinterface

export

将某个变量给外部开放使用接口

几种写法

//
export var a = 1;
export function foo() {}
 
// 打包导出
const c = "123";
function b() {}
export { c as cc, b };
// 只能这样写 不然语法会报错

export语句输出的接口,与其对应的值是动态绑定关系,即通过该接口,可以取到模块内部实时的值。

export var foo = "bar";
setTimeout(() => (foo = "baz"), 500);

最后,export命令可以出现在模块的任何位置,只要处于模块顶层就可以。如果处于块级作用域内,就会报错。这是因为处于条件代码块之中,就没法做静态优化了,违背了 ES6 模块的设计初衷。

import

import { resolve } from "path";

接收大括号,对应模块中导出的变量名

当然也可以用 as 重新取个名字

所有import进来的都是 read-only 的,也就是 const 的,但是如果是引用类型,你知道可以怎么做吧。

注意:

  • import是会提升的(因为在编译阶段执行)

  • 不要在import的时候使用动态的构造,比如import {'f' + 'oo'} from 'foo',这些都是 runtime 的东西。。

  • 只写import xxx,只会执行这个模块,多次写也只会执行一次

  • import { foo } from "my_module";
    import { bar } from "my_module";
     
    // 等同于
    import { foo, bar } from "my_module";
    // 对应的是同一个 my_module
  • import是单例模式

export default

为模块指定默认输出,用户不需要知道这个模块有什么东西,一股脑的导入即可,可以任意命名。

// import-default.js
import customName from "./export-default";
customName(); // 'foo'

export default之后的有名字的函数都“名亡实存”了

注意:

  • 只能出现一次
  • 可以和普通export并存

本质上,export default就是输出一个叫做default的变量或方法,然后系统允许你为它取任意名字。所以,下面的写法是有效的。

export const e = "123123";
 
export { e as default };
// 等价于
// export default e
import $ from "lodash"; // 鲁大师也能是 dollar

其实通过转码之后的export default会编译为exports.default = xxxx

export 与 import 的复合写法

如果在一个模块之中,先输入后输出同一个模块,import语句可以与export语句写在一起。

export { foo, bar } from "my_module";
// 向外转发了这两个接口 实际并没有导入到当前模块
 
// 可以简单理解为
import { foo, bar } from "my_module";
export { foo, bar };

用到这样的场景?

// 接口改名
export { foo as myFoo } from "my_module";
 
// 整体输出
export * from "my_module";

其他的情况见阮一峰

import()

import是在编译时静态处理(提升到最前处理),那么我们想动态的导入模块怎么办呢?

import命令叫做“连接” binding 其实更合适

为了提升动态性,ES2020 提案引入import()函数

import(specifier)
  .then((module) => {
    // ...
  })
  .catch((err) => {
    // ...
  });

返回一个 Promise 。

import()函数与所加载的模块没有静态连接关系,这点也是与import语句不相同。import()类似于 Node 的require方法,区别主要是前者是异步加载,后者是同步加载。

适用场景

  • 按需加载(懒加载): vue-router 的懒加载就传入一个 import 函数即可
  • 条件加载
  • 动态路径加载

注意

  • 加载后这个模块会作为一个对象
  • 可以用结构的方式获取属性
  • default属性获取默认导出的变量:
    • .then(({default: ddd}) => {...}) ddd 就是这个模块
    • asyncawait 的时候同样 const { default: _ } = await import('lodash');
    • 其实就是整个模块对象有个 default 的属性。
  • 也可以在async函数里面用!
  • 多个模块导入可以用Promise.all()

浏览器支持 ES Module

<script type="module" src="./foo.js"></script>

浏览器加载模块(type="module")的时候是异步处理的

<script type="module" src="./foo.js"></script>
<!-- 等同于 -->
<script type="module" src="./foo.js" defer></script>

也可以给async属性让他异步加载

其实看到这样调用模块有点迷惑,其实在foo.js这个文件中就是一个有import语句的 ES Module

也可以直接让 js 标签作为模块语法

<script type="module">
  import $ from "./jquery/src/jquery.js";
  $("#message").text("Hi from jQuery!");
</script>

注意:代码是有 module 作用域的,自动use strict

Node.js 中使用 ES Module

由于 CommonJS 和 ES 不兼容,所以比较麻烦,但是在 v13.2 版本开始支持了

Node.js 要求 ES6 模块采用.mjs后缀文件名。Node.js 遇到.mjs文件,就认为它是 ES6 模块,默认启用严格模式,不必在每个模块文件顶部指定"use strict"

如果不希望改成.mjs的话,可以在package.json中声明

{
  "type": "module" // 默认是 commonjs
}

此时还想用 CommonJS 的话,文件后缀名改为.cjs

main

package.json 中指定入口文件,没有"type": "module"的时候会解析为 CommonJS 模块

{
  "main": "./src/index.js"
}

exports

优先级比main,有多种用法

  • 子目录别名:

    {
      "exports": {
        "./submodule": "./src/submodule.js"
      }
    }

    ./src/submodule.js指定别名为./submodule,别人可以直接导入了import xx from 'myModule/submodule'

  • main 的别名:

    如果别名是.

    {
      "exports": {
        ".": "./main.js"
      }
    }
     
    // 等同于
    {
      "exports": "./main.js"
    }

    由于exports字段只有支持 ES6 的 Node.js 才认识,所以可以用来兼容旧版本的 Node.js。

    {
      "main": "./main-legacy.cjs",
      "exports": {
        ".": "./main-modern.cjs"
      }
    }

循环引入

CommonJS

由于动态导入的机制,如果 a 模块要引入 b,b 中也引入 a,我们在 main 函数中先导入 a,执行 a 模块代码的过程中发现引入了 b,会去执行 b,在 b 中发现引入了 a,但此时 a 没有执行完毕,所以 b 中拿到 a 的数据只是一部分的缓存,回到 a 后可能会出错。

所以我们要避免写

const foo = require("a").foo; //	此时可能 a 还没有执行完毕

ES Module

直接看例子

// a.mjs
import { bar } from "./b";
console.log("a.mjs");
console.log(bar);
export let foo = "foo";
 
// b.mjs
import { foo } from "./a";
console.log("b.mjs");
console.log(foo);
export let bar = "bar";

执行 a.mjs 会发生什么:发现 import 了 b,所以先去执行 b 了,发现 import 了 a,此时 a 以及是判断执行过了,所以认为 foo 是获取到的接口,然后继续执行到第 10 行发现 foo 实际上没有定义,就报错了。

解决方法:由于都用的是引用,用函数返回就行了,用的时候再取值

再看一个

// even.js
import { odd } from "./odd";
export var counter = 0;
export function even(n) {
  counter++;
  return n === 0 || odd(n - 1);
}
 
// odd.js
import { even } from "./even";
export function odd(n) {
  return n !== 0 && even(n - 1);
}

执行一下

$ babel-node
> import * as m from './even.js';
> m.even(10);
true
> m.counter
6
> m.even(20)
true
> m.counter
17

改成 CommonJS 就不能了

// even.js
var odd = require("./odd");
var counter = 0;
exports.counter = counter;
exports.even = function (n) {
  counter++;
  return n == 0 || odd(n - 1);
};
 
// odd.js
var even = require("./even").even; // 这里上面此时还没执行完,是undef
module.exports = function (n) {
  return n != 0 && even(n - 1);
};
// var m = require('./even');
// m.even(10)
// TypeError: even is not a function

上面例子来自阮一峰老师

对比

CommonJS 的模块化是动态的,运行时导入(那一套缓存)

ES module 是静态的连接,在编译成 AST 的时候导入/输出接口

CommonJS 模块输出的是一个值的拷贝,ES6 模块输出的是值的只读引用注意基本非引用类型,引用类型无所谓的都是指针,想改就改。。

所以在不同 ES 模块中导入同一个导出的实例都是同一个,比如 Vue,这很关键

CommonJS 中的 thismodule.exports,ES 模块是undefined

其次,以下这些顶层变量在 ES6 模块之中都是不存在的。

  • arguments
  • require
  • module
  • exports
  • __filename
  • __dirname

小结

感觉有些方面模块化这种东西大同小异,比如类比 Python , __init__.py 文件就相当于是 JS 中的 index.js 所以一个目录都可以是一个 module 或者叫 package ,但是我还是觉得 Python 中用 . 作为子模块的连接比较舒服(前提是所有路径都是模块)。

扩展

rollup 和 webpack 的区别 使用场景:https://zhuanlan.zhihu.com/p/75717476 (opens in a new tab)

思考我们打包的场景,适合用什么打包工具去打包:

  • Web App: webpack
  • js 类库: rollup