Википедия: AutoWikiBrowser/Регулярное выражение


Регулярное выражение или регулярное выражение — это последовательность символов, определяющая шаблон для поиска в тексте. Каждое появление шаблона затем может быть автоматически заменено другой строкой, которая может включать части идентифицированного шаблона. AutoWikiBrowser использует разновидность регулярных выражений .NET . [1]

Группы соответствуют последовательной строке символов (включая токены). По умолчанию совпадения с группами фиксируются для дальнейшего использования. Группы могут быть вложены в другие группы.

По умолчанию квантификаторы являются «жадными», то есть они будут соответствовать как можно большему количеству символов, при этом позволяя полному выражению найти совпадение. Добавление вопросительного знака ("?") после квалификатора сделает его нежадным, то есть он будет соответствовать как можно меньшему количеству символов, в то же время позволяя полному выражению найти совпадение. Примеры см. в разделе #Жадность и квантификаторы .

Метасимволы — это символы, имеющие особое значение в регулярном выражении; чтобы буквально соответствовать этим символам, их необходимо «экранировать», поставив перед ними escape-символ \.

Используется для проверки того, что происходит до или после, без потребления или захвата. («Без потребления» означает, что совпадения для утверждений просмотра не становятся частью заменяемой строки. В следующих примерах используется только «abc».) В регулярных выражениях .NET весь синтаксис регулярных выражений может использоваться внутри смотровое утверждение.

Токены и группы — это части регулярного выражения, за которыми может следовать квантификатор для изменения количества последовательных совпадений. Токен — это символ, специальный символ , класс символов или диапазон (например [m-q], ). Группа формируется путем заключения токенов или других групп в круглые скобки . Все это можно изменить так, чтобы оно совпадало несколько раз с помощью квантора. Например: a?, \n+, \d{4}, [m-r]*, , и .(a?\n+\d{4}[m-r]*|not){3,7}((?:97[89]-?)?(?:\d[ -]?){9}[\dXx])