Squeak.ru - шаблоны программирования

Непревзойденный [ в регулярном выражении, несмотря на экранирование

Попытка проверить функцию положения и возможности синтаксического анализа perl. У меня есть регулярное выражение, которое я считаю правильным, но perl говорит мне, что у меня есть непревзойденный [, но для меня это выглядит экранированным.

Непревзойденный [в регулярном выражении; отмечен ‹-- ЗДЕСЬ в m/\G.*[([ ‹-- ЗДЕСЬ ^]+)]/ в строке 5 perltest.pl.

Кто-нибудь может пояснить, почему я получаю это сообщение из следующего кода?

my $string = "one, [two] , [three], and [four].";

pos($string) = 0;
while (my $string =~ m{\G.*\[([^\]+)\]}cg)
{
    my $value = $1;
    print "Found value $value .\n";
};
23.01.2015

Ответы:


1

Отрицательный класс символов не завершается.

Где у вас есть

[^\]+    # One or more characters that aren't «]», «+», ...

у вас должно быть

[^\]]+   # One or more characters that aren't «]»

я бы даже использовал

[^[\]]*  # Zero or more characters that aren't «[» or «]»
23.01.2015

2

Ошибка связана с неполным классом символов...

\G.*\[([^\] +)\]
           ^

Чтобы решить эту проблему, вам нужно добавить закрывающую скобку, чтобы завершить класс.

\G.*\[([^\]]+)\]
           ^

Я предлагаю следующее, изменив + на *, чтобы вместо этого соответствовать «ноль или больше».

[^]]*
23.01.2015

3

Вы избежали только 3 из 4.

m{\G.*\[([^\]+)\]}cg)
       ^    ^   ^
         ^ - not escaped
23.01.2015
  • Только трое из четырех должны быть спасены. Проблема в том, что отсутствует ]. 23.01.2015

  • 4

    Объяснение регулярного выражения вопроса:

    m{\G.*\[([^\]+)\]}cg
    

    Это регулярное выражение является экранированным регулярным выражением perl. Неэкранированное регулярное выражение: \G.*\[([^\]+)\]

    Регулярное выражение: \G.*\[([^\]+)\] делает:

    • \G ... Утверждает, что позиция находится в конце предыдущего совпадения или в начале строки.
    • .* ... Соответствует любому символу, который не является символом разрыва строки, от нуля до неограниченного количества раз. (жадный)
    • \[ ... Соответствует символу [

    Теперь регулярное выражение не может быть обработано, есть открывающая скобка без закрывающей скобки.
    Это связано с тем, что после открывающей скобки ( начинается класс символов [, который необходимо закрыть перед закрывающей скобкой ) .
    Несмотря на это есть \] это экранированный ] и, следовательно, не закрывающая скобка класса символов.
    Таким образом, ) в регулярном выражении является частью открытого класса символов.
    Поскольку последний ] также не экранирован, ни Capturing ни группа, ни класс персонажей не закрыты.

    В регулярных выражениях Perl ] не нужно экранировать.
    Конец класса символов не должен экранироваться.

    Если \[([^\]+)\] предназначен для соответствия всем символам между [ и ] и захвата его значения в группу захвата 1, исправленная часть: \[([^\]]+)\] или даже короче \[([^]]+)]

    Итак, ближайшее рабочее регулярное выражение:

    \G.*\[([^\]]+)\]
    

    и можно сократить до

    \G.*\[([^]]+)]
    

    Если вы хотите сопоставить two three и four:

    m/\[([^]]+)]/
    
    23.01.2015
  • Можете ли вы уточнить, почему OP вообще получает ошибку? Это, кажется, главный вопрос, а не только правильное регулярное выражение 24.01.2015

  • 5

    Вы можете обнаружить, что добавление пробелов в регулярное выражение, чтобы сделать его более читабельным, может помочь вам увидеть, что происходит. Кроме того, у вас слишком много "my $string" там :-)

    my $string = "one, [two] , [three], and [four].";
    
    while ($string =~ m{
            \G.*
            \[
                (  [^\]]+  )
            \]
        }cgx)
    {
        my $value = $1;
        print "Found value $value .\n";
    };
    
    23.01.2015
    Новые материалы

    Угловая структура архитектуры
    Обратите внимание, что эта статья устарела, я решил создать новую с лучшей структурой и с учетом автономных компонентов: https://medium.com/@marekpanti/angular-standalone-architecture-b645edd0d54a..

    «Данные, которые большинство людей используют для обучения своих моделей искусственного интеллекта, поставляются со встроенным…
    Первоначально опубликовано HalkTalks: https://hacktown.com.br/blog/blog/os-dados-que-a-maioria-das-pessoas-usa-para-treinar-seus-modelos-de-inteligencia-artificial- ja-vem-com-um-vies-embutido/..

    Сильный ИИ против слабого ИИ: различия парадигм искусственного интеллекта
    В последние годы изучению и развитию искусственного интеллекта (ИИ) уделяется большое внимание и прогресс. Сильный ИИ и Слабый ИИ — две основные парадигмы в области искусственного интеллекта...

    Правильный способ добавить Firebase в ваш проект React с помощью React Hooks
    React + Firebase - это мощная комбинация для быстрого и безопасного создания приложений, от проверки концепции до массового производства. Раньше (знаете, несколько месяцев назад) добавление..

    Создайте API с помощью Python FastAPI
    Создание API с помощью Python становится очень простым при использовании пакета FastAPI. После установки и импорта вы можете создать приложение FastAPI и указать несколько конечных точек. Каждой..

    Веселье с прокси-сервером JavaScript
    Прокси-серверы JavaScript — это чистый сахар, если вы хотите создать некоторую общую логику в своих приложениях, чтобы облегчить себе жизнь. Вот один пример: Связь клиент-сервер Мы..

    Получить бесплатный хостинг для разработчиков | Разместите свой сайт за несколько шагов 🔥
    Статические веб-сайты — это веб-страницы с фиксированным содержанием и его постоянным содержанием. Но теперь статические сайты также обрабатывают динамические данные с помощью API и запросов...