Вопрос о группах в регекспах

SMLG · 13.Сентябрь.2018 10:22:56

Я взял regexp из современного учебника по JavaScript:
Например, мы хотим найти в тексте ссылки вида <a href="..." class="doc"> , с любым содержанием href .

var reg = /<a href="[^"]*" class="doc">/g;
alert( str1.match(reg) );

У меня он тоже работает. Теперь я пытаюсь заменить ссылку в тегах:

console.log(
  decodedContent.replace(
    /(<a href=)"[^"]*"( class="doc">)/g,
    '$1"http://google.com"$2'
  )
);

Мой регксп цепляет весь текст (хоть и заменяет содержимое ссылки).

Вопрос: почему регексп цепляет весь текст?

SMLG · 13.Сентябрь.2018 10:25:50

Вроде бы понял. Это специфика работы метода replace, он не просто ищет совпадение, а производит замену.

SMLG · 13.Сентябрь.2018 20:26:42

Вопрос другой: почему регексп цепляет только первые буквы названий?

"Java JavaScript PHP C++ C C# Perl6".match(/\b[A-Z][a-zA-Z0-9\+#]*\b/g)

dmitry · 13.Сентябрь.2018 20:34:47

\b - это word boundary символ. С его точки зрения C++ - это 2 слова. "Java JavaScript PHP C++ C C# Perl6".split(/\b/g).

Regexp будет работать как ты ожидаешь если убрать последний \b. "Java JavaScript PHP C++ C C# Perl6".match(/\b[A-Z][a-zA-Z0-9\+\#]*/g)

SMLG · 13.Сентябрь.2018 20:42:32

Нет, не потому он цеплял только первые буквы! Этот чудак, который пишет перезаписал файлы из папки в другую, а live-server “шурует” по старой схеме и ищет их, работает со старой версией.
PS тот регексп верный.

dmitry · 13.Сентябрь.2018 20:44:08

Я подумал о том что для “C++” и “C#” зацелил только буквы C

SMLG · 13.Сентябрь.2018 20:45:26

Похоже, что \b шарпы в слово не учел

SMLG · 13.Сентябрь.2018 20:53:26

Вот так

"Java JavaScript PHP C++ C C# Perl6".match(/\b[A-Z][a-zA-Z0-9+#]*\s?/g)

можно, а потом truncate пробелы.