feat: refactoring project

2024-11-23 14:56:07 -05:00
parent f0c2a50c18
commit 1c6db5818d
2351 changed files with 39323 additions and 60326 deletions
--- a/node_modules/regexpu-core/README.md
+++ b/node_modules/regexpu-core/README.md
@@ -27,13 +27,13 @@ This module exports a single function named `rewritePattern`.
 This function takes a string that represents a regular expression pattern as well as a string representing its flags, and returns an ES5-compatible version of the pattern.

 ```js
-rewritePattern('foo.bar', 'u');
+rewritePattern('foo.bar', 'u', { unicodeFlag: "transform" });
 // → 'foo(?:[\\0-\\t\\x0B\\f\\x0E-\\u2027\\u202A-\\uD7FF\\uDC00-\\uFFFF]|[\\uD800-\\uDBFF][\\uDC00-\\uDFFF]|[\\uD800-\\uDBFF])bar'

-rewritePattern('[\\u{1D306}-\\u{1D308}a-z]', 'u');
+rewritePattern('[\\u{1D306}-\\u{1D308}a-z]', 'u', { unicodeFlag: "transform" });
 // → '(?:[a-z]|\\uD834[\\uDF06-\\uDF08])'

-rewritePattern('[\\u{1D306}-\\u{1D308}a-z]', 'ui');
+rewritePattern('[\\u{1D306}-\\u{1D308}a-z]', 'ui', { unicodeFlag: "transform" });
 // → '(?:[a-z\\u017F\\u212A]|\\uD834[\\uDF06-\\uDF08])'
 ```

@@ -41,11 +41,11 @@ _regexpu-core_ can rewrite non-ES6 regular expressions too, which is useful to d

 ```js
 // In ES5, the dot operator only matches BMP symbols:
-rewritePattern('foo.bar');
+rewritePattern('foo.bar', '', { unicodeFlag: "transform" });
 // → 'foo(?:[\\0-\\t\\x0B\\f\\x0E-\\u2027\\u202A-\\uFFFF])bar'

 // But with the ES2015 `u` flag, it matches astral symbols too:
-rewritePattern('foo.bar', 'u');
+rewritePattern('foo.bar', 'u', { unicodeFlag: "transform" });
 // → 'foo(?:[\\0-\\t\\x0B\\f\\x0E-\\u2027\\u202A-\\uD7FF\\uDC00-\\uFFFF]|[\\uD800-\\uDBFF][\\uDC00-\\uDFFF]|[\\uD800-\\uDBFF])bar'
 ```

@@ -114,19 +114,13 @@ These options can be set to `false` or `'transform'`. When using `'transform'`,
  // → '(.)\1'
  ```

-#### Experimental regular expression features
-
-These options can be set to `false`, `'parse'` and `'transform'`. When using `'transform'`, the corresponding features are compiled to older syntax that can run in older browsers. When using `'parse'`, they are parsed and left as-is in the output pattern. When using `false` (the default), they result in a syntax error if used.
-
-Once these features become stable (when the proposals are accepted as part of ECMAScript), they will be parsed by default and thus `'parse'` will behave like `false`.
-
 - `unicodeSetsFlag` - [The `v` (`unicodeSets`) flag](https://github.com/tc39/proposal-regexp-set-notation)

  ```js
-  rewritePattern('[\\p{Emoji}&&\\p{ASCII}]', 'u', {
+  rewritePattern('[\\p{Emoji}&&\\p{ASCII}]', 'v', {
    unicodeSetsFlag: 'transform'
  });
-  // → '[#\*0-9]'
+  // → '[#\\*0-9]'
  ```

  By default, patterns with the `v` flag are transformed to patterns with the `u` flag. If you want to downlevel them more you can set the `unicodeFlag: 'transform'` option.
@@ -146,7 +140,7 @@ Once these features become stable (when the proposals are accepted as part of EC
  // → '(?:(?![f-h])[\s\S])' (to be used without /u)
  ```

- `modifiers` - [Inline `m`/`s`/`i` modifiers](https://github.com/tc39/proposal-regexp-modifiers)
+- `modifiers` - [Inline `i`/`m`/`s` modifiers](https://github.com/tc39/proposal-regexp-modifiers)

  ```js
  rewritePattern('(?i:[a-z])[a-z]', '', {
@@ -155,6 +149,12 @@ Once these features become stable (when the proposals are accepted as part of EC
  // → '(?:[a-zA-Z])([a-z])'
  ```

+#### Experimental regular expression features
+
+These options can be set to `false`, `'parse'` and `'transform'`. When using `'transform'`, the corresponding features are compiled to older syntax that can run in older browsers. When using `'parse'`, they are parsed and left as-is in the output pattern. When using `false` (the default), they result in a syntax error if used.
+
+Once these features become stable (when the proposals are accepted as part of ECMAScript), they will be parsed by default and thus `'parse'` will behave like `false`.
+
 #### Miscellaneous options

 - `onNamedGroup`
--- a/node_modules/regexpu-core/data/character-class-escape-sets.js
+++ b/node_modules/regexpu-core/data/character-class-escape-sets.js
@@ -2,6 +2,7 @@
 'use strict';

 const regenerate = require('regenerate');
+const UNICODE_IV_SET = require('./all-characters.js').UNICODE_IV_SET

 exports.REGULAR = new Map([
 	['d', regenerate()
@@ -103,3 +104,24 @@ exports.UNICODE_IGNORE_CASE = new Map([
 		.addRange(0x180, 0x2129)
 		.addRange(0x212B, 0x10FFFF)]
 ]);
+
+exports.UNICODESET_IGNORE_CASE = new Map([
+	['d', regenerate()
+		.addRange(0x30, 0x39)],
+	['D', UNICODE_IV_SET.clone().remove(regenerate()
+		.addRange(0x30, 0x39))],
+	['s', regenerate(0x20, 0xA0, 0x1680, 0x202F, 0x205F, 0x3000, 0xFEFF)
+		.addRange(0x9, 0xD)
+		.addRange(0x2000, 0x200A)
+		.addRange(0x2028, 0x2029)],
+	['S', UNICODE_IV_SET.clone().remove(regenerate(0x20, 0xA0, 0x1680, 0x202F, 0x205F, 0x3000, 0xFEFF)
+		.addRange(0x9, 0xD)
+		.addRange(0x2000, 0x200A)
+		.addRange(0x2028, 0x2029))],
+	['w', regenerate(0x5F)
+		.addRange(0x30, 0x39)
+		.addRange(0x61, 0x7A)],
+	['W', UNICODE_IV_SET.clone().remove(regenerate(0x5F)
+		.addRange(0x30, 0x39)
+		.addRange(0x61, 0x7A))]
+]);
--- a/node_modules/regexpu-core/data/iu-mappings.js
+++ b/node_modules/regexpu-core/data/iu-mappings.js
@@ -17,6 +17,7 @@ module.exports = new Map([
 	[0x1F1, 0x1F2],
 	[0x1F2, 0x1F1],
 	[0x345, 0x1FBE],
+	[0x390, 0x1FD3],
 	[0x392, 0x3D0],
 	[0x395, 0x3F5],
 	[0x398, 0x3F4],
@@ -28,6 +29,7 @@ module.exports = new Map([
 	[0x3A3, 0x3C2],
 	[0x3A6, 0x3D5],
 	[0x3A9, 0x2126],
+	[0x3B0, 0x1FE3],
 	[0x3B8, 0x3F4],
 	[0x3C2, 0x3A3],
 	[0x3C9, 0x2126],
@@ -121,6 +123,8 @@ module.exports = new Map([
 	]],
 	[0x1FC3, 0x1FCC],
 	[0x1FCC, 0x1FC3],
+	[0x1FD3, 0x390],
+	[0x1FE3, 0x3B0],
 	[0x1FF3, 0x1FFC],
 	[0x1FFC, 0x1FF3],
 	[0x2126, [
@@ -133,6 +137,8 @@ module.exports = new Map([
 		0xE5
 	]],
 	[0xA64A, 0x1C88],
+	[0xFB05, 0xFB06],
+	[0xFB06, 0xFB05],
 	[0x10400, 0x10428],
 	[0x10401, 0x10429],
 	[0x10402, 0x1042A],
@@ -457,6 +463,50 @@ module.exports = new Map([
 	[0x10CF0, 0x10CB0],
 	[0x10CF1, 0x10CB1],
 	[0x10CF2, 0x10CB2],
+	[0x10D50, 0x10D70],
+	[0x10D51, 0x10D71],
+	[0x10D52, 0x10D72],
+	[0x10D53, 0x10D73],
+	[0x10D54, 0x10D74],
+	[0x10D55, 0x10D75],
+	[0x10D56, 0x10D76],
+	[0x10D57, 0x10D77],
+	[0x10D58, 0x10D78],
+	[0x10D59, 0x10D79],
+	[0x10D5A, 0x10D7A],
+	[0x10D5B, 0x10D7B],
+	[0x10D5C, 0x10D7C],
+	[0x10D5D, 0x10D7D],
+	[0x10D5E, 0x10D7E],
+	[0x10D5F, 0x10D7F],
+	[0x10D60, 0x10D80],
+	[0x10D61, 0x10D81],
+	[0x10D62, 0x10D82],
+	[0x10D63, 0x10D83],
+	[0x10D64, 0x10D84],
+	[0x10D65, 0x10D85],
+	[0x10D70, 0x10D50],
+	[0x10D71, 0x10D51],
+	[0x10D72, 0x10D52],
+	[0x10D73, 0x10D53],
+	[0x10D74, 0x10D54],
+	[0x10D75, 0x10D55],
+	[0x10D76, 0x10D56],
+	[0x10D77, 0x10D57],
+	[0x10D78, 0x10D58],
+	[0x10D79, 0x10D59],
+	[0x10D7A, 0x10D5A],
+	[0x10D7B, 0x10D5B],
+	[0x10D7C, 0x10D5C],
+	[0x10D7D, 0x10D5D],
+	[0x10D7E, 0x10D5E],
+	[0x10D7F, 0x10D5F],
+	[0x10D80, 0x10D60],
+	[0x10D81, 0x10D61],
+	[0x10D82, 0x10D62],
+	[0x10D83, 0x10D63],
+	[0x10D84, 0x10D64],
+	[0x10D85, 0x10D65],
 	[0x118A0, 0x118C0],
 	[0x118A1, 0x118C1],
 	[0x118A2, 0x118C2],
--- a/node_modules/regexpu-core/package.json
+++ b/node_modules/regexpu-core/package.json
@@ -1,6 +1,6 @@
 {
 	"name": "regexpu-core",
-	"version": "5.3.2",
+	"version": "6.2.0",
 	"description": "regexpu’s core functionality (i.e. `rewritePattern(pattern, flag)`), capable of translating ES6 Unicode regular expressions to ES5.",
 	"homepage": "https://mths.be/regexpu",
 	"main": "rewrite-pattern.js",
@@ -39,29 +39,28 @@
 	"files": [
 		"LICENSE-MIT.txt",
 		"rewrite-pattern.js",
+		"data/all-characters.js",
 		"data/character-class-escape-sets.js",
+		"data/i-bmp-mappings.js",
+		"data/iu-foldings.js",
 		"data/iu-mappings.js"
 	],
 	"scripts": {
-		"build": "node scripts/iu-mappings.js && node scripts/character-class-escape-sets.js",
-		"test": "mocha tests",
-		"cover": "istanbul cover --report html node_modules/.bin/_mocha tests -- -u exports -R spec"
+		"build": "node scripts/index.js",
+		"test": "node --test tests/tests.js",
+		"test-node6": "mocha tests",
+		"cover": "NODE_V8_COVERAGE=coverage node --test  --experimental-test-coverage tests/tests.js"
 	},
 	"dependencies": {
 		"regenerate": "^1.4.2",
-		"regenerate-unicode-properties": "^10.1.0",
-		"@babel/regjsgen": "^0.8.0",
-		"regjsparser": "^0.9.1",
+		"regenerate-unicode-properties": "^10.2.0",
+		"regjsgen": "^0.8.0",
+		"regjsparser": "^0.12.0",
 		"unicode-match-property-ecmascript": "^2.0.0",
 		"unicode-match-property-value-ecmascript": "^2.1.0"
 	},
 	"devDependencies": {
-		"codecov": "^3.8.3",
-		"istanbul": "^0.4.5",
 		"jsesc": "^3.0.2",
-		"lodash": "^4.17.21",
-		"mocha": "^10.1.0",
-		"regexpu-fixtures": "^2.1.6",
-		"@unicode/unicode-15.0.0": "^1.3.1"
+		"@unicode/unicode-16.0.0": "^1.6.2"
 	}
 }
--- a/node_modules/regexpu-core/rewrite-pattern.js
+++ b/node_modules/regexpu-core/rewrite-pattern.js
@@ -1,12 +1,15 @@
 'use strict';

-const generate = require('@babel/regjsgen').generate;
+const generate = require('regjsgen').generate;
 const parse = require('regjsparser').parse;
 const regenerate = require('regenerate');
 const unicodeMatchProperty = require('unicode-match-property-ecmascript');
 const unicodeMatchPropertyValue = require('unicode-match-property-value-ecmascript');
 const iuMappings = require('./data/iu-mappings.js');
+const iBMPMappings = require('./data/i-bmp-mappings.js');
+const iuFoldings = require('./data/iu-foldings.js');
 const ESCAPE_SETS = require('./data/character-class-escape-sets.js');
+const { UNICODE_SET, UNICODE_IV_SET } = require('./data/all-characters.js');

 function flatMap(array, callback) {
 	const result = [];
@@ -21,11 +24,13 @@ function flatMap(array, callback) {
 	return result;
 }

-const SPECIAL_CHARS = /([\\^$.*+?()[\]{}|])/g;
+function regenerateContainsAstral(regenerateData) {
+	const data = regenerateData.data;
+	return data.length >= 1 && data[data.length - 1] >= 0x10000;
+}

-// Prepare a Regenerate set containing all code points, used for negative
-// character classes (if any).
-const UNICODE_SET = regenerate().addRange(0x0, 0x10FFFF);
+// https://tc39.es/ecma262/#prod-SyntaxCharacter
+const SYNTAX_CHARS = /[\\^$.*+?()[\]{}|]/g;

 const ASTRAL_SET = regenerate().addRange(0x10000, 0x10FFFF);

@@ -42,10 +47,15 @@ const NEWLINE_SET = regenerate().add(
 const DOT_SET_UNICODE = UNICODE_SET.clone() // all Unicode code points
 	.remove(NEWLINE_SET);

-const getCharacterClassEscapeSet = (character, unicode, ignoreCase) => {
+const getCharacterClassEscapeSet = (character, unicode, ignoreCase, shouldApplySCF) => {
 	if (unicode) {
 		if (ignoreCase) {
-			return ESCAPE_SETS.UNICODE_IGNORE_CASE.get(character);
+			const result = ESCAPE_SETS.UNICODE_IGNORE_CASE.get(character);
+			if (shouldApplySCF) {
+				return ESCAPE_SETS.UNICODESET_IGNORE_CASE.get(character);
+			} else {
+				return result;
+			}
 		}
 		return ESCAPE_SETS.UNICODE.get(character);
 	}
@@ -89,7 +99,7 @@ const handleLoneUnicodePropertyNameOrValue = (value) => {
 	return getUnicodePropertyValueSet(property);
 };

-const getUnicodePropertyEscapeSet = (value, isNegative) => {
+const getUnicodePropertyEscapeSet = (value, isNegative, isUnicodeSetIgnoreCase) => {
 	const parts = value.split('=');
 	const firstPart = parts[0];
 	let set;
@@ -106,7 +116,7 @@ const getUnicodePropertyEscapeSet = (value, isNegative) => {
 			throw new Error('Cannot negate Unicode property of strings');
 		}
 		return {
-			characters: UNICODE_SET.clone().remove(set.characters),
+			characters: (isUnicodeSetIgnoreCase ? UNICODE_IV_SET : UNICODE_SET).clone().remove(set.characters),
 			strings: new Set()
 		};
 	}
@@ -114,15 +124,25 @@ const getUnicodePropertyEscapeSet = (value, isNegative) => {
 		characters: set.characters.clone(),
 		strings: set.strings
 			// We need to escape strings like *️⃣ to make sure that they can be safely used in unions.
-			? new Set(set.strings.map(str => str.replace(SPECIAL_CHARS, '\\$1')))
+			? new Set(set.strings.map(str => str.replace(SYNTAX_CHARS, '\\$&')))
 			: new Set()
 	};
 };

-const getUnicodePropertyEscapeCharacterClassData = (property, isNegative) => {
-	const set = getUnicodePropertyEscapeSet(property, isNegative);
+const getUnicodePropertyEscapeCharacterClassData = (property, isNegative, isUnicodeSetIgnoreCase, shouldApplySCF) => {
+	const set = getUnicodePropertyEscapeSet(property, isNegative, isUnicodeSetIgnoreCase);
 	const data = getCharacterClassEmptyData();
-	data.singleChars = set.characters;
+	const singleChars = shouldApplySCF ? regenerate(set.characters.toArray().map(ch => simpleCaseFolding(ch))) : set.characters;
+	const caseEqFlags = configGetCaseEqFlags();
+	if (caseEqFlags) {
+		for (const codepoint of singleChars.toArray()) {
+			const list = getCaseEquivalents(codepoint, caseEqFlags);
+			if (list) {
+				singleChars.add(list);
+			}
+		}
+	}
+	data.singleChars = singleChars;
 	if (set.strings.size > 0) {
 		data.longStrings = set.strings;
 		data.maybeIncludesStrings = true;
@@ -130,35 +150,45 @@ const getUnicodePropertyEscapeCharacterClassData = (property, isNegative) => {
 	return data;
 };

-function configNeedCaseFoldAscii() {
-	return !!config.modifiersData.i;
+const CASE_EQ_FLAG_NONE = 0b00;
+const CASE_EQ_FLAG_BMP = 0b01;
+const CASE_EQ_FLAG_UNICODE = 0b10;
+
+function configGetCaseEqFlags() {
+	let flags = CASE_EQ_FLAG_NONE;
+	if (config.modifiersData.i === true) {
+		if (config.transform.modifiers) {
+			flags |= CASE_EQ_FLAG_BMP;
+			if (config.flags.unicode || config.flags.unicodeSets) {
+				flags |= CASE_EQ_FLAG_UNICODE;
+			}
+		}
+	} else if (config.modifiersData.i === undefined) {
+		if (config.transform.unicodeFlag && config.flags.ignoreCase) {
+			flags |= CASE_EQ_FLAG_UNICODE;
+		}
+	}
+	return flags;
 }

-function configNeedCaseFoldUnicode() {
-	// config.modifiersData.i : undefined | false
-	if (config.modifiersData.i === false) return false;
-	if (!config.transform.unicodeFlag) return false;
-	return Boolean(config.modifiersData.i || config.flags.ignoreCase);
-}
-
-// Given a range of code points, add any case-folded code points in that range
+// Given a range of code points, add any case-equivalent code points in that range
 // to a set.
-regenerate.prototype.iuAddRange = function(min, max) {
+regenerate.prototype.iuAddRange = function(min, max, caseEqFlags) {
 	const $this = this;
 	do {
-		const folded = caseFold(min, configNeedCaseFoldAscii(), configNeedCaseFoldUnicode());
-		if (folded) {
-			$this.add(folded);
+		const list = getCaseEquivalents(min, caseEqFlags);
+		if (list) {
+			$this.add(list);
 		}
 	} while (++min <= max);
 	return $this;
 };
-regenerate.prototype.iuRemoveRange = function(min, max) {
+regenerate.prototype.iuRemoveRange = function(min, max, caseEqFlags) {
 	const $this = this;
 	do {
-		const folded = caseFold(min, configNeedCaseFoldAscii(), configNeedCaseFoldUnicode());
-		if (folded) {
-			$this.remove(folded);
+		const list = getCaseEquivalents(min, caseEqFlags);
+		if (list) {
+			$this.remove(list);
 		}
 	} while (++min <= max);
 	return $this;
@@ -195,19 +225,50 @@ const wrap = (tree, pattern) => {
 	};
 };

-const caseFold = (codePoint, includeAscii, includeUnicode) => {
-	let folded = (includeUnicode ? iuMappings.get(codePoint) : undefined) || [];
-	if (typeof folded === 'number') folded = [folded];
-	if (includeAscii) {
-		if (codePoint >= 0x41 && codePoint <= 0x5A) {
-			folded.push(codePoint + 0x20);
-		} else if (codePoint >= 0x61 && codePoint <= 0x7A) {
-			folded.push(codePoint - 0x20);
+/**
+ * Given any codepoint ch, returns false or an array of characters,
+ * such that for every c in the array,
+ *   c != ch and Canonicalize(~, c) == Canonicalize(~, ch)
+ * 
+ * where Canonicalize is defined in
+ * https://tc39.es/ecma262/#sec-runtime-semantics-canonicalize-ch
+ * @param {number} codePoint input code point
+ * @param {number} flags bitwise flags composed of CASE_EQ_FLAG_*
+ * @returns false | number[]
+ */
+const getCaseEquivalents = (codePoint, flags) => {
+	if (flags === CASE_EQ_FLAG_NONE) {
+		return false;
+	}
+	let result = ((flags & CASE_EQ_FLAG_UNICODE) ? iuMappings.get(codePoint) : undefined) || [];
+	if (typeof result === "number") result = [result];
+	if (flags & CASE_EQ_FLAG_BMP) {
+		for (const cp of [codePoint].concat(result)) {
+			// Fast path for ASCII characters
+			if (cp >= 0x41 && cp <= 0x5a) {
+				result.push(cp + 0x20);
+			} else if (cp >= 0x61 && cp <= 0x7a) {
+				result.push(cp - 0x20);
+			} else {
+				result = result.concat(iBMPMappings.get(cp) || []);
+			}
 		}
 	}
-	return folded.length == 0 ? false : folded;
+	return result.length == 0 ? false : result;
 };

+// https://tc39.es/ecma262/#sec-maybesimplecasefolding
+const simpleCaseFolding = (codePoint) => {
+	// Fast path for ASCII characters
+	if (codePoint <= 0x7F) {
+		if (codePoint >= 0x41 && codePoint <= 0x5A) {
+			return codePoint + 0x20;
+		}
+		return codePoint;
+	}
+	return iuFoldings.get(codePoint) || codePoint;
+}
+
 const buildHandler = (action) => {
 	switch (action) {
 		case 'union':
@@ -221,8 +282,8 @@ const buildHandler = (action) => {
 				range: (data, start, end) => {
 					data.singleChars.addRange(start, end);
 				},
-				iuRange: (data, start, end) => {
-					data.singleChars.iuAddRange(start, end);
+				iuRange: (data, start, end, caseEqFlags) => {
+					data.singleChars.iuAddRange(start, end, caseEqFlags);
 				},
 				nested: (data, nestedData) => {
 					data.singleChars.add(nestedData.singleChars);
@@ -243,8 +304,8 @@ const buildHandler = (action) => {
 				range: (data, start, end) => {
 					data.singleChars = UNICODE_SET.clone().removeRange(start, end).add(data.singleChars);
 				},
-				iuRange: (data, start, end) => {
-					data.singleChars = UNICODE_SET.clone().iuRemoveRange(start, end).add(data.singleChars);
+				iuRange: (data, start, end, caseEqFlags) => {
+					data.singleChars = UNICODE_SET.clone().iuRemoveRange(start, end, caseEqFlags).add(data.singleChars);
 				},
 				nested: (data, nestedData) => {
 					regSet(data, nestedData.singleChars);
@@ -274,9 +335,9 @@ const buildHandler = (action) => {
 					data.longStrings.clear();
 					data.maybeIncludesStrings = false;
 				},
-				iuRange: (data, start, end) => {
-					if (data.first) data.singleChars.iuAddRange(start, end);
-					else data.singleChars.intersection(regenerate().iuAddRange(start, end));
+				iuRange: (data, start, end, caseEqFlags) => {
+					if (data.first) data.singleChars.iuAddRange(start, end, caseEqFlags);
+					else data.singleChars.intersection(regenerate().iuAddRange(start, end, caseEqFlags));
 					data.longStrings.clear();
 					data.maybeIncludesStrings = false;
 				},
@@ -310,9 +371,9 @@ const buildHandler = (action) => {
 					if (data.first) data.singleChars.addRange(start, end);
 					else data.singleChars.removeRange(start, end);
 				},
-				iuRange: (data, start, end) => {
-					if (data.first) data.singleChars.iuAddRange(start, end);
-					else data.singleChars.iuRemoveRange(start, end);
+				iuRange: (data, start, end, caseEqFlags) => {
+					if (data.first) data.singleChars.iuAddRange(start, end, caseEqFlags);
+					else data.singleChars.iuRemoveRange(start, end, caseEqFlags);
 				},
 				nested: (data, nestedData) => {
 					regSet(data, nestedData.singleChars);
@@ -330,7 +391,7 @@ const buildHandler = (action) => {
 		}
 		// The `default` clause is only here as a safeguard; it should never be
 		// reached. Code coverage tools should ignore it.
-		/* istanbul ignore next */
+		/* node:coverage ignore next */
 		default:
 			throw new Error(`Unknown set action: ${ characterClassItem.kind }`);
 	}
@@ -345,42 +406,40 @@ const getCharacterClassEmptyData = () => ({
 	maybeIncludesStrings: false
 });

-const maybeFold = (codePoint) => {
-	const caseFoldAscii = configNeedCaseFoldAscii();
-	const caseFoldUnicode = configNeedCaseFoldUnicode();
-
-	if (caseFoldAscii || caseFoldUnicode) {
-		const folded = caseFold(codePoint, caseFoldAscii, caseFoldUnicode);
-		if (folded) {
-			return [codePoint, folded];
-		}
+const concatCaseEquivalents = (codePoint, caseEqFlags) => {
+	const caseEquivalents = getCaseEquivalents(codePoint, caseEqFlags);
+	if (caseEquivalents) {
+		return [codePoint, ...caseEquivalents];
 	}
 	return [codePoint];
 };

-const computeClassStrings = (classStrings, regenerateOptions) => {
+const computeClassStrings = (classStrings, regenerateOptions, caseEqFlags, shouldApplySCF) => {
 	let data = getCharacterClassEmptyData();

-	const caseFoldAscii = configNeedCaseFoldAscii();
-	const caseFoldUnicode = configNeedCaseFoldUnicode();
-
 	for (const string of classStrings.strings) {
 		if (string.characters.length === 1) {
-			maybeFold(string.characters[0].codePoint).forEach((cp) => {
+			const codePoint = shouldApplySCF ? simpleCaseFolding(string.characters[0].codePoint) : string.characters[0].codePoint
+			concatCaseEquivalents(codePoint, caseEqFlags).forEach((cp) => {
 				data.singleChars.add(cp);
 			});
 		} else {
-			let stringifiedString;
-			if (caseFoldUnicode || caseFoldAscii) {
-				stringifiedString = '';
+			let stringifiedString = '';
+			if (caseEqFlags) {
 				for (const ch of string.characters) {
-					let set = regenerate(ch.codePoint);
-					const folded = maybeFold(ch.codePoint);
-					if (folded) set.add(folded);
+					const codePoint = shouldApplySCF ? simpleCaseFolding(ch.codePoint) : ch.codePoint;
+					const set = regenerate(concatCaseEquivalents(codePoint, caseEqFlags));
 					stringifiedString += set.toString(regenerateOptions);
 				}
 			} else {
-				stringifiedString = string.characters.map(ch => generate(ch)).join('')
+				for (const ch of string.characters) {
+					const codePoint = shouldApplySCF ? simpleCaseFolding(ch.codePoint) : ch.codePoint;
+					if (codePoint !== ch.codePoint) {
+						stringifiedString += regenerate(codePoint).toString(regenerateOptions);
+					} else {
+						stringifiedString += generate(ch);
+					}
+				}
 			}

 			data.longStrings.add(stringifiedString);
@@ -391,12 +450,14 @@ const computeClassStrings = (classStrings, regenerateOptions) => {
 	return data;
 }

-const computeCharacterClass = (characterClassItem, regenerateOptions) => {
+const computeCharacterClass = (characterClassItem, regenerateOptions, shouldApplySCF) => {
 	let data = getCharacterClassEmptyData();

 	let handlePositive;
 	let handleNegative;

+	let caseEqFlags = configGetCaseEqFlags();
+
 	switch (characterClassItem.kind) {
 		case 'union':
 			handlePositive = buildHandler('union');
@@ -406,66 +467,88 @@ const computeCharacterClass = (characterClassItem, regenerateOptions) => {
 			handlePositive = buildHandler('intersection');
 			handleNegative = buildHandler('subtraction');
 			if (config.transform.unicodeSetsFlag) data.transformed = true;
+			if (config.isIgnoreCaseMode) {
+				shouldApplySCF = true;
+			}
 			break;
 		case 'subtraction':
 			handlePositive = buildHandler('subtraction');
 			handleNegative = buildHandler('intersection');
 			if (config.transform.unicodeSetsFlag) data.transformed = true;
+			if (config.isIgnoreCaseMode) {
+				shouldApplySCF = true;
+			}
 			break;
 		// The `default` clause is only here as a safeguard; it should never be
 		// reached. Code coverage tools should ignore it.
-		/* istanbul ignore next */
+		/* node:coverage ignore next */
 		default:
 			throw new Error(`Unknown character class kind: ${ characterClassItem.kind }`);
 	}

-	const caseFoldAscii = configNeedCaseFoldAscii();
-	const caseFoldUnicode = configNeedCaseFoldUnicode();
-
 	for (const item of characterClassItem.body) {
 		switch (item.type) {
 			case 'value':
-				maybeFold(item.codePoint).forEach((cp) => {
-					handlePositive.single(data, cp);
-				});
+				const codePoint = shouldApplySCF ? simpleCaseFolding(item.codePoint) : item.codePoint;
+				const list = concatCaseEquivalents(codePoint, caseEqFlags);
+				handlePositive.regSet(data, regenerate(list));
+				if (list.length > 1) {
+					data.transformed = true;
+				}
 				break;
 			case 'characterClassRange':
 				const min = item.min.codePoint;
 				const max = item.max.codePoint;
-				handlePositive.range(data, min, max);
-				if (caseFoldAscii || caseFoldUnicode) {
-					handlePositive.iuRange(data, min, max);
+				if (shouldApplySCF) {
+					let list = [];
+					for (let cp = min; cp <= max; cp++) {
+						list.push(simpleCaseFolding(cp));
+					}
+					handlePositive.regSet(data, regenerate(list));
+				} else {
+					handlePositive.range(data, min, max);
+				}
+				if (caseEqFlags) {
+					// If shouldApplySCF is true, it is still ok to call iuRange because 
+					// the set [min, max] shares the same case equivalents with scf([min, max])
+					handlePositive.iuRange(data, min, max, caseEqFlags);
 					data.transformed = true;
 				}
 				break;
 			case 'characterClassEscape':
 				handlePositive.regSet(data, getCharacterClassEscapeSet(
 					item.value,
-					config.flags.unicode,
-					config.flags.ignoreCase
+					config.flags.unicode || config.flags.unicodeSets,
+					config.flags.ignoreCase,
+					shouldApplySCF
 				));
 				break;
 			case 'unicodePropertyEscape':
-				const nestedData = getUnicodePropertyEscapeCharacterClassData(item.value, item.negative);
+				const nestedData = getUnicodePropertyEscapeCharacterClassData(
+					item.value,
+					item.negative,
+					config.flags.unicodeSets && config.isIgnoreCaseMode,
+					shouldApplySCF
+				);
 				handlePositive.nested(data, nestedData);
 				data.transformed =
 					data.transformed ||
 					config.transform.unicodePropertyEscapes ||
-					(config.transform.unicodeSetsFlag && nestedData.maybeIncludesStrings);
+					(config.transform.unicodeSetsFlag && (nestedData.maybeIncludesStrings || characterClassItem.kind !== "union" || item.negative));
 				break;
 			case 'characterClass':
 				const handler = item.negative ? handleNegative : handlePositive;
-				const res = computeCharacterClass(item, regenerateOptions);
+				const res = computeCharacterClass(item, regenerateOptions, shouldApplySCF);
 				handler.nested(data, res);
 				data.transformed = true;
 				break;
 			case 'classStrings':
-				handlePositive.nested(data, computeClassStrings(item, regenerateOptions));
+				handlePositive.nested(data, computeClassStrings(item, regenerateOptions, caseEqFlags, shouldApplySCF));
 				data.transformed = true;
 				break;
 			// The `default` clause is only here as a safeguard; it should never be
 			// reached. Code coverage tools should ignore it.
-			/* istanbul ignore next */
+			/* node:coverage ignore next */
 			default:
 				throw new Error(`Unknown term type: ${ item.type }`);
 		}
@@ -488,13 +571,15 @@ const processCharacterClass = (
 	const negative = characterClassItem.negative;
 	const { singleChars, transformed, longStrings } = computed;
 	if (transformed) {
-		const setStr = singleChars.toString(regenerateOptions);
+		// If single chars already contains some astral character, regenerate (bmpOnly: true) will create valid regex strings
+		const bmpOnly = regenerateContainsAstral(singleChars);
+		const setStr = singleChars.toString(Object.assign({}, regenerateOptions, { bmpOnly: bmpOnly }));

 		if (negative) {
 			if (config.useUnicodeFlag) {
 				update(characterClassItem, `[^${setStr[0] === '[' ? setStr.slice(1, -1) : setStr}]`)
 			} else {
-				if (config.flags.unicode) {
+				if (config.flags.unicode || config.flags.unicodeSets) {
 					if (config.flags.ignoreCase) {
 						const astralCharsSet = singleChars.clone().intersection(ASTRAL_SET);
 						// Assumption: singleChars do not contain lone surrogates.
@@ -514,17 +599,15 @@ const processCharacterClass = (
 						// The transform here does not support lone surrogates.
 						update(
 							characterClassItem,
-							`(?!${surrogateOrBMPSetStr})[\\s\\S]|${astralNegativeSetStr}`
+							`(?!${surrogateOrBMPSetStr})[^]|${astralNegativeSetStr}`
 						);
 					} else {
 						// Generate negative set directly when case folding is not involved.
-						update(
-							characterClassItem,
-							UNICODE_SET.clone().remove(singleChars).toString(regenerateOptions)
-						);
+						const negativeSet = UNICODE_SET.clone().remove(singleChars);
+						update(characterClassItem, negativeSet.toString(regenerateOptions));
 					}
 				} else {
-					update(characterClassItem, `(?!${setStr})[\\s\\S]`);
+					update(characterClassItem, `(?!${setStr})[^]`);
 				}
 			}
 		} else {
@@ -552,17 +635,19 @@ const processModifiers = (item, regenerateOptions, groups) => {
 	const enabling = item.modifierFlags.enabling;
 	const disabling = item.modifierFlags.disabling;

-	delete item.modifierFlags;
-	item.behavior = 'ignore';
-
 	const oldData = Object.assign({}, config.modifiersData);

-	enabling.split('').forEach(flag => {
+	for (const flag of enabling) {
 		config.modifiersData[flag] = true;
-	});
-	disabling.split('').forEach(flag => {
+	}
+	for (const flag of disabling) {
 		config.modifiersData[flag] = false;
-	});
+	}
+
+	if (config.transform.modifiers) {
+		delete item.modifierFlags;
+		item.behavior = 'ignore';
+	}

 	item.body = item.body.map(term => {
 		return processTerm(term, regenerateOptions, groups);
@@ -579,18 +664,18 @@ const processTerm = (item, regenerateOptions, groups) => {
 			if (config.transform.unicodeFlag) {
 				update(
 					item,
-					getUnicodeDotSet(config.flags.dotAll || config.modifiersData.s).toString(regenerateOptions)
+					getUnicodeDotSet(config.isDotAllMode).toString(regenerateOptions)
 				);
-			} else if (config.transform.dotAllFlag || config.modifiersData.s) {
+			} else if ((config.modifiersData.s != null ? config.modifiersData.s && config.transform.modifiers : config.transform.dotAllFlag)) {
 				// TODO: consider changing this at the regenerate level.
-				update(item, '[\\s\\S]');
+				update(item, '[^]');
 			}
 			break;
 		case 'characterClass':
 			item = processCharacterClass(item, regenerateOptions);
 			break;
 		case 'unicodePropertyEscape':
-			const data = getUnicodePropertyEscapeCharacterClassData(item.value, item.negative);
+			const data = getUnicodePropertyEscapeCharacterClassData(item.value, item.negative, config.flags.unicodeSets && config.isIgnoreCaseMode);
 			if (data.maybeIncludesStrings) {
 				if (!config.flags.unicodeSets) {
 					throw new Error(
@@ -601,7 +686,7 @@ const processTerm = (item, regenerateOptions, groups) => {
 					data.transformed = true;
 					item = processCharacterClass(item, regenerateOptions, data);
 				}
-			} else if (config.transform.unicodePropertyEscapes) {
+			} else if (config.transform.unicodePropertyEscapes || configGetCaseEqFlags()) {
 				update(
 					item,
 					data.singleChars.toString(regenerateOptions)
@@ -652,7 +737,7 @@ const processTerm = (item, regenerateOptions, groups) => {
 					delete groups.unmatchedReferences[name];
 				}
 			}
-			if (item.modifierFlags && config.transform.modifiers) {
+			if (item.modifierFlags) {
 				return processModifiers(item, regenerateOptions, groups);
 			}
 			/* falls through */
@@ -677,9 +762,13 @@ const processTerm = (item, regenerateOptions, groups) => {
 			break;
 		case 'value':
 			const codePoint = item.codePoint;
-			const set = regenerate(codePoint);
-			const folded = maybeFold(codePoint);
-			set.add(folded);
+			const caseEqFlags = configGetCaseEqFlags();
+			const list = concatCaseEquivalents(codePoint, caseEqFlags);
+			if (list.length === 1 && item.kind === "symbol" && codePoint >= 0x20 && codePoint <= 0x7E) {
+				// skip regenerate when it is a printable ASCII symbol
+				break;
+			}
+			const set = regenerate(list);
 			update(item, set.toString(regenerateOptions));
 			break;
 		case 'reference':
@@ -719,7 +808,7 @@ const processTerm = (item, regenerateOptions, groups) => {
 			}
 			break;
 		case 'anchor':
-			if (config.modifiersData.m) {
+			if (config.modifiersData.m && config.transform.modifiers) {
 				if (item.kind == 'start') {
 					update(item, `(?:^|(?<=${NEWLINE_SET.toString()}))`);
 				} else if (item.kind == 'end') {
@@ -731,7 +820,7 @@ const processTerm = (item, regenerateOptions, groups) => {
 			break;
 		// The `default` clause is only here as a safeguard; it should never be
 		// reached. Code coverage tools should ignore it.
-		/* istanbul ignore next */
+		/* node:coverage ignore next */
 		default:
 			throw new Error(`Unknown term type: ${ item.type }`);
 	}
@@ -761,6 +850,12 @@ const config = {
 	},
 	get useUnicodeFlag() {
 		return (this.flags.unicode || this.flags.unicodeSets) && !this.transform.unicodeFlag;
+	},
+	get isDotAllMode() {
+		return (this.modifiersData.s !== undefined ? this.modifiersData.s : this.flags.dotAll);
+	},
+	get isIgnoreCaseMode() {
+		return (this.modifiersData.i !== undefined ? this.modifiersData.i : this.flags.ignoreCase);
 	}
 };

@@ -773,13 +868,14 @@ const validateOptions = (options) => {
 			case 'dotAllFlag':
 			case 'unicodeFlag':
 			case 'unicodePropertyEscapes':
+			case 'unicodeSetsFlag':
 			case 'namedGroups':
 				if (value != null && value !== false && value !== 'transform') {
 					throw new Error(`.${key} must be false (default) or 'transform'.`);
 				}
 				break;
+			// todo: remove modifiers: 'parse' in regexpu-core v7
 			case 'modifiers':
-			case 'unicodeSetsFlag':
 				if (value != null && value !== false && value !== 'parse' && value !== 'transform') {
 					throw new Error(`.${key} must be false (default), 'parse' or 'transform'.`);
 				}
@@ -813,7 +909,7 @@ const rewritePattern = (pattern, flags, options) => {
 	config.transform.unicodeSetsFlag = config.flags.unicodeSets && transform(options, 'unicodeSetsFlag');

 	// unicodeFlag: 'transform' implies unicodePropertyEscapes: 'transform'
-	config.transform.unicodePropertyEscapes = config.flags.unicode && (
+	config.transform.unicodePropertyEscapes = (config.flags.unicode || config.flags.unicodeSets) && (
 		transform(options, 'unicodeFlag') || transform(options, 'unicodePropertyEscapes')
 	);
 	config.transform.namedGroups = transform(options, 'namedGroups');
@@ -824,18 +920,17 @@ const rewritePattern = (pattern, flags, options) => {
 	config.modifiersData.m = undefined;

 	const regjsparserFeatures = {
-		'unicodeSet': Boolean(options && options.unicodeSetsFlag),
-		'modifiers': Boolean(options && options.modifiers),
-
 		// Enable every stable RegExp feature by default
+		'modifiers': true,
 		'unicodePropertyEscape': true,
+		'unicodeSet': true,
 		'namedGroups': true,
 		'lookbehind': true,
 	};

 	const regenerateOptions = {
 		'hasUnicodeFlag': config.useUnicodeFlag,
-		'bmpOnly': !config.flags.unicode
+		'bmpOnly': !config.flags.unicode && !config.flags.unicodeSets
 	};

 	const groups = {
@@ -862,10 +957,8 @@ const rewritePattern = (pattern, flags, options) => {
 					for (const key of Object.keys(node)) {
 						const value = node[key];
 						if (key == 'modifierFlags') {
-							if (value.disabling.length > 0){
-								value.disabling.split('').forEach((flag)=>{
-									allDisabledModifiers[flag] = true
-								});
+							for (const flag of value.disabling) {
+								allDisabledModifiers[flag] = true;
 							}
 						} else if (typeof value == 'object' && value != null) {
 							itemStack.push(value);
@@ -873,8 +966,14 @@ const rewritePattern = (pattern, flags, options) => {
 					}
 				}
 			}
-			for (const flag of Object.keys(allDisabledModifiers)) {
-				config.modifiersData[flag] = true;
+			if (allDisabledModifiers.i) {
+				config.modifiersData.i = config.flags.ignoreCase;
+			}
+			if (allDisabledModifiers.m) {
+				config.modifiersData.m = config.flags.multiline;
+			}
+			if (allDisabledModifiers.s) {
+				config.modifiersData.s = config.flags.dotAll;
 			}
 		}
 	}
@@ -892,7 +991,7 @@ const rewritePattern = (pattern, flags, options) => {
 		if (config.transform.unicodeFlag) {
 			newFlags = newFlags.replace('u', '');
 		}
-		if (config.transform.dotAllFlag === 'transform') {
+		if (config.transform.dotAllFlag) {
 			newFlags = newFlags.replace('s', '');
 		}
 		onNewFlags(newFlags);