regexp_test.go 19 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687
  1. package goja
  2. import (
  3. "testing"
  4. )
  5. func TestRegexp1(t *testing.T) {
  6. const SCRIPT = `
  7. var r = new RegExp("(['\"])(.*?)\\1");
  8. var m = r.exec("'test'");
  9. m !== null && m.length == 3 && m[2] === "test";
  10. `
  11. testScript1(SCRIPT, valueTrue, t)
  12. }
  13. func TestRegexp2(t *testing.T) {
  14. const SCRIPT = `
  15. var r = new RegExp("(['\"])(.*?)['\"]");
  16. var m = r.exec("'test'");
  17. m !== null && m.length == 3 && m[2] === "test";
  18. `
  19. testScript1(SCRIPT, valueTrue, t)
  20. }
  21. func TestRegexpLiteral(t *testing.T) {
  22. const SCRIPT = `
  23. var r = /(['\"])(.*?)\1/;
  24. var m = r.exec("'test'");
  25. m !== null && m.length == 3 && m[2] === "test";
  26. `
  27. testScript1(SCRIPT, valueTrue, t)
  28. }
  29. func TestRegexpRe2Unicode(t *testing.T) {
  30. const SCRIPT = `
  31. var r = /(тест)/i;
  32. var m = r.exec("'Тест'");
  33. m !== null && m.length == 2 && m[1] === "Тест";
  34. `
  35. testScript1(SCRIPT, valueTrue, t)
  36. }
  37. func TestRegexpRe2UnicodeTarget(t *testing.T) {
  38. const SCRIPT = `
  39. var r = /(['\"])(.*?)['\"]/i;
  40. var m = r.exec("'Тест'");
  41. m !== null && m.length == 3 && m[2] === "Тест";
  42. `
  43. testScript1(SCRIPT, valueTrue, t)
  44. }
  45. func TestRegexpRegexp2Unicode(t *testing.T) {
  46. const SCRIPT = `
  47. var r = /(['\"])(тест)\1/i;
  48. var m = r.exec("'Тест'");
  49. m !== null && m.length == 3 && m[2] === "Тест";
  50. `
  51. testScript1(SCRIPT, valueTrue, t)
  52. }
  53. func TestRegexpRegexp2UnicodeTarget(t *testing.T) {
  54. const SCRIPT = `
  55. var r = /(['\"])(.*?)\1/;
  56. var m = r.exec("'Тест'");
  57. m !== null && m.length == 3 && m[2] === "Тест";
  58. `
  59. testScript1(SCRIPT, valueTrue, t)
  60. }
  61. func TestRegexpRe2Whitespace(t *testing.T) {
  62. const SCRIPT = `
  63. "\u2000\u2001\u2002\u200b".replace(/\s+/g, "") === "\u200b";
  64. `
  65. testScript1(SCRIPT, valueTrue, t)
  66. }
  67. func TestRegexpRegexp2Whitespace(t *testing.T) {
  68. const SCRIPT = `
  69. "A\u2000\u2001\u2002A\u200b".replace(/(A)\s+\1/g, "") === "\u200b"
  70. `
  71. testScript1(SCRIPT, valueTrue, t)
  72. }
  73. func TestEmptyCharClassRe2(t *testing.T) {
  74. const SCRIPT = `
  75. /[]/.test("\u0000");
  76. `
  77. testScript1(SCRIPT, valueFalse, t)
  78. }
  79. func TestNegatedEmptyCharClassRe2(t *testing.T) {
  80. const SCRIPT = `
  81. /[^]/.test("\u0000");
  82. `
  83. testScript1(SCRIPT, valueTrue, t)
  84. }
  85. func TestEmptyCharClassRegexp2(t *testing.T) {
  86. const SCRIPT = `
  87. /([])\1/.test("\u0000\u0000");
  88. `
  89. testScript1(SCRIPT, valueFalse, t)
  90. }
  91. func TestRegexp2Negate(t *testing.T) {
  92. const SCRIPT = `
  93. /([\D1])\1/.test("aa");
  94. `
  95. testScript1(SCRIPT, valueTrue, t)
  96. }
  97. func TestAlternativeRe2(t *testing.T) {
  98. const SCRIPT = `
  99. /()|/.exec("") !== null;
  100. `
  101. testScript1(SCRIPT, valueTrue, t)
  102. }
  103. func TestRegexpReplaceGlobal(t *testing.T) {
  104. const SCRIPT = `
  105. "QBZPbage\ny_cynprubyqre".replace(/^\s*|\s*$/g, '')
  106. `
  107. testScript1(SCRIPT, asciiString("QBZPbage\ny_cynprubyqre"), t)
  108. }
  109. func TestRegexpNumCaptures(t *testing.T) {
  110. const SCRIPT = `
  111. "Fubpxjnir Synfu 9.0 e115".replace(/([a-zA-Z]|\s)+/, '')
  112. `
  113. testScript1(SCRIPT, asciiString("9.0 e115"), t)
  114. }
  115. func TestRegexpNumCaptures1(t *testing.T) {
  116. const SCRIPT = `
  117. "Fubpxjnir Sy\tfu 9.0 e115".replace(/^.*\s+(\S+\s+\S+$)/, '')
  118. `
  119. testScript1(SCRIPT, asciiString(""), t)
  120. }
  121. func TestRegexpSInClass(t *testing.T) {
  122. const SCRIPT = `
  123. /[\S]/.test("\u2028");
  124. `
  125. testScript1(SCRIPT, valueFalse, t)
  126. }
  127. func TestRegexpDotMatchCR(t *testing.T) {
  128. const SCRIPT = `
  129. /./.test("\r");
  130. `
  131. testScript1(SCRIPT, valueFalse, t)
  132. }
  133. func TestRegexpDotMatchCRInGroup(t *testing.T) {
  134. const SCRIPT = `
  135. /(.)/.test("\r");
  136. `
  137. testScript1(SCRIPT, valueFalse, t)
  138. }
  139. func TestRegexpDotMatchLF(t *testing.T) {
  140. const SCRIPT = `
  141. /./.test("\n");
  142. `
  143. testScript1(SCRIPT, valueFalse, t)
  144. }
  145. func TestRegexpSplitWithBackRef(t *testing.T) {
  146. const SCRIPT = `
  147. "a++b+-c".split(/([+-])\1/).join(" $$ ")
  148. `
  149. testScript1(SCRIPT, asciiString("a $$ + $$ b+-c"), t)
  150. }
  151. func TestEscapeNonASCII(t *testing.T) {
  152. const SCRIPT = `
  153. /\⩓/.test("⩓")
  154. `
  155. testScript1(SCRIPT, valueTrue, t)
  156. }
  157. func TestRegexpUTF16(t *testing.T) {
  158. const SCRIPT = `
  159. var str = "\uD800\uDC00";
  160. assert(/\uD800/g.test(str), "#1");
  161. assert(/\uD800/.test(str), "#2");
  162. assert(/𐀀/.test(str), "#3");
  163. var re = /\uD800/;
  164. assert(compareArray(str.replace(re, "X"), ["X", "\uDC00"]), "#4");
  165. assert(compareArray(str.split(re), ["", "\uDC00"]), "#5");
  166. assert(compareArray("a\uD800\uDC00b".split(/\uD800/g), ["a", "\uDC00b"]), "#6");
  167. assert(compareArray("a\uD800\uDC00b".split(/(?:)/g), ["a", "\uD800", "\uDC00", "b"]), "#7");
  168. assert(compareArray("0\x80".split(/(0){0}/g), ["0", undefined, "\x80"]), "#7+");
  169. re = /(?=)a/; // a hack to use regexp2
  170. assert.sameValue(re.exec('\ud83d\ude02a').index, 2, "#8");
  171. assert.sameValue(/./.exec('\ud83d\ude02')[0], '\ud83d', "#9");
  172. assert(RegExp("\uD800").test("\uD800"), "#10");
  173. var cu = 0xD800;
  174. var xx = "a\\" + String.fromCharCode(cu);
  175. var pattern = eval("/" + xx + "/");
  176. assert.sameValue(pattern.source, "a\\\\\\ud800", "Code unit: " + cu.toString(16), "#11");
  177. assert(pattern.test("a\\\uD800"), "#12");
  178. `
  179. testScript1(TESTLIB+SCRIPT, _undefined, t)
  180. }
  181. func TestRegexpUnicode(t *testing.T) {
  182. const SCRIPT = `
  183. assert(!/\uD800/u.test("\uD800\uDC00"), "#1");
  184. assert(!/\uFFFD/u.test("\uD800\uDC00"), "#2");
  185. assert(/\uD800\uDC00/u.test("\uD800\uDC00"), "#3");
  186. assert(/\uD800/u.test("\uD800"), "#4");
  187. assert(compareArray("a\uD800\uDC00b".split(/\uD800/gu), ["a\uD800\uDC00b"]), "#5");
  188. assert(compareArray("a\uD800\uDC00b".split(/(?:)/gu), ["a", "𐀀", "b"]), "#6");
  189. assert(compareArray("0\x80".split(/(0){0}/gu), ["0", undefined, "\x80"]), "#7");
  190. var re = eval('/' + /\ud834\udf06/u.source + '/u');
  191. assert(re.test('\ud834\udf06'), "#9");
  192. /*re = RegExp("\\p{L}", "u");
  193. if (!re.test("A")) {
  194. throw new Error("Test 9 failed");
  195. }*/
  196. `
  197. testScript1(TESTLIB+SCRIPT, _undefined, t)
  198. }
  199. func TestConvertRegexpToUnicode(t *testing.T) {
  200. if s := convertRegexpToUnicode(`test\uD800\u0C00passed`); s != `test\uD800\u0C00passed` {
  201. t.Fatal(s)
  202. }
  203. if s := convertRegexpToUnicode(`test\uD800\uDC00passed`); s != `test𐀀passed` {
  204. t.Fatal(s)
  205. }
  206. if s := convertRegexpToUnicode(`test\u0023passed`); s != `test\u0023passed` {
  207. t.Fatal(s)
  208. }
  209. if s := convertRegexpToUnicode(`test\u0passed`); s != `test\u0passed` {
  210. t.Fatal(s)
  211. }
  212. if s := convertRegexpToUnicode(`test\uD800passed`); s != `test\uD800passed` {
  213. t.Fatal(s)
  214. }
  215. if s := convertRegexpToUnicode(`test\uD800`); s != `test\uD800` {
  216. t.Fatal(s)
  217. }
  218. if s := convertRegexpToUnicode(`test\uD80`); s != `test\uD80` {
  219. t.Fatal(s)
  220. }
  221. if s := convertRegexpToUnicode(`\\uD800\uDC00passed`); s != `\\uD800\uDC00passed` {
  222. t.Fatal(s)
  223. }
  224. if s := convertRegexpToUnicode(`testpassed`); s != `testpassed` {
  225. t.Fatal(s)
  226. }
  227. }
  228. func TestConvertRegexpToUtf16(t *testing.T) {
  229. if s := convertRegexpToUtf16(`𐀀`); s != `\ud800\udc00` {
  230. t.Fatal(s)
  231. }
  232. if s := convertRegexpToUtf16(`\𐀀`); s != `\\\ud800\udc00` {
  233. t.Fatal(s)
  234. }
  235. }
  236. func TestEscapeInvalidUtf16(t *testing.T) {
  237. if s := escapeInvalidUtf16(asciiString("test")); s != "test" {
  238. t.Fatal(s)
  239. }
  240. if s := escapeInvalidUtf16(newStringValue("test\U00010000")); s != "test\U00010000" {
  241. t.Fatal(s)
  242. }
  243. if s := escapeInvalidUtf16(unicodeStringFromRunes([]rune{'t', 0xD800})); s != "t\\ud800" {
  244. t.Fatal(s)
  245. }
  246. if s := escapeInvalidUtf16(unicodeStringFromRunes([]rune{'t', 0xD800, 'p'})); s != "t\\ud800p" {
  247. t.Fatal(s)
  248. }
  249. if s := escapeInvalidUtf16(unicodeStringFromRunes([]rune{0xD800, 'p'})); s != "\\ud800p" {
  250. t.Fatal(s)
  251. }
  252. if s := escapeInvalidUtf16(unicodeStringFromRunes([]rune{'t', '\\', 0xD800, 'p'})); s != `t\\\ud800p` {
  253. t.Fatal(s)
  254. }
  255. }
  256. func TestRegexpAssertion(t *testing.T) {
  257. const SCRIPT = `
  258. var res = 'aaa'.match(/^a/g);
  259. res.length === 1 || res[0] === 'a';
  260. `
  261. testScript1(SCRIPT, valueTrue, t)
  262. }
  263. func TestRegexpUnicodeAdvanceStringIndex(t *testing.T) {
  264. const SCRIPT = `
  265. // deoptimise RegExp
  266. var origExec = RegExp.prototype.exec;
  267. RegExp.prototype.exec = function(s) {
  268. return origExec.call(this, s);
  269. };
  270. var re = /(?:)/gu;
  271. var str = "a\uD800\uDC00b";
  272. assert(compareArray(str.split(re), ["a", "𐀀", "b"]), "#1");
  273. re.lastIndex = 3;
  274. assert.sameValue(re.exec(str).index, 3, "#2");
  275. re.lastIndex = 2;
  276. assert.sameValue(re.exec(str).index, 1, "#3");
  277. re.lastIndex = 4;
  278. assert.sameValue(re.exec(str).index, 4, "#4");
  279. re.lastIndex = 5;
  280. assert.sameValue(re.exec(str), null, "#5");
  281. `
  282. testScript1(TESTLIB+SCRIPT, _undefined, t)
  283. }
  284. func TestRegexpInit(t *testing.T) {
  285. const SCRIPT = `
  286. RegExp(".").lastIndex;
  287. `
  288. testScript1(SCRIPT, intToValue(0), t)
  289. }
  290. func TestRegexpToString(t *testing.T) {
  291. const SCRIPT = `
  292. RegExp.prototype.toString.call({
  293. source: 'foo',
  294. flags: 'bar'});
  295. `
  296. testScript1(SCRIPT, asciiString("/foo/bar"), t)
  297. }
  298. func TestRegexpEscapeSource(t *testing.T) {
  299. const SCRIPT = `
  300. /href="(.+?)(\/.*\/\S+?)\/"/.source;
  301. `
  302. testScript1(SCRIPT, asciiString(`href="(.+?)(\/.*\/\S+?)\/"`), t)
  303. }
  304. func TestRegexpConsecutiveMatchCache(t *testing.T) {
  305. const SCRIPT = `
  306. (function test(unicode) {
  307. var regex = new RegExp('t(e)(st(\\d?))', unicode?'gu':'g');
  308. var string = 'test1test2';
  309. var match;
  310. var matches = [];
  311. while (match = regex.exec(string)) {
  312. matches.push(match);
  313. }
  314. var expectedMatches = [
  315. [
  316. 'test1',
  317. 'e',
  318. 'st1',
  319. '1'
  320. ],
  321. [
  322. 'test2',
  323. 'e',
  324. 'st2',
  325. '2'
  326. ]
  327. ];
  328. expectedMatches[0].index = 0;
  329. expectedMatches[0].input = 'test1test2';
  330. expectedMatches[1].index = 5;
  331. expectedMatches[1].input = 'test1test2';
  332. assert(deepEqual(matches, expectedMatches), "#1");
  333. // try the same regexp with a different string
  334. regex.lastIndex = 0;
  335. match = regex.exec(' test5');
  336. var expectedMatch = [
  337. 'test5',
  338. 'e',
  339. 'st5',
  340. '5'
  341. ];
  342. expectedMatch.index = 1;
  343. expectedMatch.input = ' test5';
  344. assert(deepEqual(match, expectedMatch), "#2");
  345. assert.sameValue(regex.lastIndex, 6, "#3");
  346. // continue matching with a different string
  347. match = regex.exec(' test5test6');
  348. expectedMatch = [
  349. 'test6',
  350. 'e',
  351. 'st6',
  352. '6'
  353. ];
  354. expectedMatch.index = 6;
  355. expectedMatch.input = ' test5test6';
  356. assert(deepEqual(match, expectedMatch), "#4");
  357. assert.sameValue(regex.lastIndex, 11, "#5");
  358. match = regex.exec(' test5test6');
  359. assert.sameValue(match, null, "#6");
  360. return regex;
  361. });
  362. `
  363. vm := New()
  364. v, err := vm.RunString(TESTLIBX + SCRIPT)
  365. if err != nil {
  366. t.Fatal(err)
  367. }
  368. var f func(bool) (*Object, error)
  369. err = vm.ExportTo(v, &f)
  370. if err != nil {
  371. t.Fatal(err)
  372. }
  373. regex, err := f(false)
  374. if err != nil {
  375. t.Fatal(err)
  376. }
  377. if regex.self.(*regexpObject).pattern.regexp2Wrapper.cache != nil {
  378. t.Fatal("Cache is not nil (non-unicode)")
  379. }
  380. regex, err = f(true)
  381. if err != nil {
  382. t.Fatal(err)
  383. }
  384. if regex.self.(*regexpObject).pattern.regexp2Wrapper.cache != nil {
  385. t.Fatal("Cache is not nil (unicode)")
  386. }
  387. }
  388. func TestRegexpOverrideSpecies(t *testing.T) {
  389. const SCRIPT = `
  390. Object.defineProperty(RegExp, Symbol.species, {
  391. configurable: true,
  392. value: function() {
  393. throw "passed";
  394. }
  395. });
  396. try {
  397. "ab".split(/a/);
  398. throw new Error("Expected error");
  399. } catch(e) {
  400. if (e !== "passed") {
  401. throw e;
  402. }
  403. }
  404. `
  405. testScript1(SCRIPT, _undefined, t)
  406. }
  407. func TestRegexp2InvalidEscape(t *testing.T) {
  408. testScript1(`/(?=)\x0/.test("x0")`, valueTrue, t)
  409. }
  410. func TestRegexpUnicodeEmptyMatch(t *testing.T) {
  411. testScript1(`/(0)0|/gu.exec("0\xef").length === 2`, valueTrue, t)
  412. }
  413. func TestRegexpInvalidGroup(t *testing.T) {
  414. const SCRIPT = `
  415. ["?", "(?)"].forEach(function(s) {
  416. assert.throws(SyntaxError, function() {new RegExp(s)}, s);
  417. });
  418. `
  419. testScript1(TESTLIB+SCRIPT, _undefined, t)
  420. }
  421. func TestRegexpLookbehindAssertion(t *testing.T) {
  422. const SCRIPT = `
  423. var re = /(?<=Jack|Tom)Sprat/;
  424. assert(re.test("JackSprat"), "#1");
  425. assert(!re.test("JohnSprat"), "#2");
  426. re = /(?<!-)\d+/;
  427. assert(re.test("3"), "#3");
  428. assert(!re.test("-3"), "#4");
  429. `
  430. testScript1(TESTLIB+SCRIPT, _undefined, t)
  431. }
  432. func TestRegexpInvalidUTF8(t *testing.T) {
  433. vm := New()
  434. // Note that normally vm.ToValue() would replace invalid UTF-8 sequences with RuneError
  435. _, err := vm.New(vm.Get("RegExp"), asciiString([]byte{0xAD}))
  436. if err == nil {
  437. t.Fatal("Expected error")
  438. }
  439. }
  440. // this should not cause data races when run with -race
  441. func TestRegexpConcurrentLiterals(t *testing.T) {
  442. prg := MustCompile("test.js", `var r = /(?<!-)\d+/; r.test("");`, false)
  443. go func() {
  444. vm := New()
  445. _, err := vm.RunProgram(prg)
  446. if err != nil {
  447. panic(err)
  448. }
  449. }()
  450. vm := New()
  451. _, _ = vm.RunProgram(prg)
  452. }
  453. func BenchmarkRegexpSplitWithBackRef(b *testing.B) {
  454. const SCRIPT = `
  455. "aaaaaaaaaaaaaaaaaaaaaaaaa++bbbbbbbbbbbbbbbbbbbbbb+-ccccccccccccccccccccccc".split(/([+-])\1/)
  456. `
  457. b.StopTimer()
  458. prg, err := Compile("test.js", SCRIPT, false)
  459. if err != nil {
  460. b.Fatal(err)
  461. }
  462. vm := New()
  463. b.StartTimer()
  464. for i := 0; i < b.N; i++ {
  465. vm.RunProgram(prg)
  466. }
  467. }
  468. func BenchmarkRegexpMatch(b *testing.B) {
  469. const SCRIPT = `
  470. "a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  471. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  472. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  473. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  474. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  475. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  476. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  477. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  478. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  479. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  480. ".match(/[^\r\n]+/g)
  481. `
  482. b.StopTimer()
  483. prg, err := Compile("test.js", SCRIPT, false)
  484. if err != nil {
  485. b.Fatal(err)
  486. }
  487. vm := New()
  488. b.StartTimer()
  489. for i := 0; i < b.N; i++ {
  490. vm.RunProgram(prg)
  491. }
  492. }
  493. func BenchmarkRegexpMatchCache(b *testing.B) {
  494. const SCRIPT = `
  495. (function() {
  496. var s = "a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  497. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  498. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  499. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  500. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  501. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  502. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  503. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  504. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  505. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  506. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  507. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  508. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  509. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  510. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  511. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  512. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  513. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  514. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  515. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  516. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  517. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  518. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  519. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  520. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  521. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  522. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  523. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  524. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  525. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  526. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  527. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  528. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  529. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  530. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  531. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  532. a\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\ra\nb\r\c\nd\r\e\n\f\rg\nh\r\
  533. "
  534. var r = /[^\r\n]+/g
  535. while(r.exec(s)) {};
  536. });
  537. `
  538. vm := New()
  539. v, err := vm.RunString(SCRIPT)
  540. if err != nil {
  541. b.Fatal(err)
  542. }
  543. if fn, ok := AssertFunction(v); ok {
  544. b.ResetTimer()
  545. b.ReportAllocs()
  546. for i := 0; i < b.N; i++ {
  547. fn(_undefined)
  548. }
  549. } else {
  550. b.Fatal("not a function")
  551. }
  552. }
  553. func BenchmarkRegexpSingleExec(b *testing.B) {
  554. vm := New()
  555. regexp := vm.Get("RegExp")
  556. f := func(reStr, str string, b *testing.B) {
  557. r, err := vm.New(regexp, vm.ToValue(reStr))
  558. if err != nil {
  559. b.Fatal(err)
  560. }
  561. exec, ok := AssertFunction(r.Get("exec"))
  562. if !ok {
  563. b.Fatal("RegExp.exec is not a function")
  564. }
  565. arg := vm.ToValue(str)
  566. b.ResetTimer()
  567. b.ReportAllocs()
  568. for i := 0; i < b.N; i++ {
  569. _, err := exec(r, arg)
  570. if err != nil {
  571. b.Fatal(err)
  572. }
  573. }
  574. }
  575. b.Run("Re-ASCII", func(b *testing.B) {
  576. f("test", "aaaaaaaaaaaaaaaaaaaaaaaaa testing", b)
  577. })
  578. b.Run("Re2-ASCII", func(b *testing.B) {
  579. f("(?=)test", "aaaaaaaaaaaaaaaaaaaaaaaaa testing", b)
  580. })
  581. b.Run("Re-Unicode", func(b *testing.B) {
  582. f("test", "aaaaaaaaaaaaaaaaaaaaaaaaa testing 😀", b)
  583. })
  584. b.Run("Re2-Unicode", func(b *testing.B) {
  585. f("(?=)test", "aaaaaaaaaaaaaaaaaaaaaaaaa testing 😀", b)
  586. })
  587. }