Wyrażenia regularne używane w Archivarix CMS

Wysłane przez: 2020-02-06

W tym artykule opisano wyrażenia regularne używane do wyszukiwania i zastępowania treści na stronach internetowych przywróconych za pomocą systemu Archivarix. Nie są one unikalne dla tego systemu. Jeśli znasz wyrażenia regularne PHP, Perl, Java lub innych języków programowania, to wiesz już, jak korzystać z naszego wyszukiwania i zamieniać.

Wyrażenia regularne to formalny język do wyszukiwania i manipulowania podciągami w tekście, oparty na użyciu metaznaków. Do wyszukiwania używany jest szablon składający się ze znaków i metaznaków oraz definiujący regułę wyszukiwania. W przypadku manipulacji tekstem określono również dodatkowy ciąg zastępujący, który może również zawierać znaki specjalne.

Oto internetowy konstruktor wyrażeń regularnych, który umożliwia tworzenie i testowanie wyrażeń regularnych za pomocą prostego interfejsu - https://regexr.com/

Lista użytych wyrażeń regularnych:

[abc] Pojedynczy znak: a, b, c
[^ abc] Dowolny pojedynczy znak oprócz a, b, c
[az] Dowolny pojedynczy znak z zakresu az
[a-zA-Z] Dowolny pojedynczy znak z zakresu az lub AZ
^ Początek linii
$ Koniec linii
\ A Początek ciągu
\ z Koniec łańcucha
. Dowolny pojedynczy znak
Dowolny biały znak
\ S Dowolny znak spacji
\ d Dowolna cyfra
\ D Dowolna cyfra
\ w Dowolny znak słowa (litera, cyfra, podkreślenie)
\ W Dowolny znak inny niż słowo
\ b Dowolny znak granicy słowa
(...) Uchwyć wszystko w załączeniu
(a | b) a lub b
a? Zero lub jeden z
a * zero lub więcej
a + Jeden lub więcej z
{3} Dokładnie 3 z
{3,} 3 lub więcej z
{3,6} Między 3 a 6 z

Wykorzystanie materiałów artykułu jest dozwolone tylko wtedy, gdy opublikowany jest link do źródła: https://pl.archivarix.com/blog/regex/

Najnowsze wiadomości:
2020.02.14
Новая пятница, новые обновления!
Много нового и полезного было сделано в Archivarix CMS:
- В Поиске и Замене теперь можно фильтровать по дате урла.
- Теперь внешние ссылки со всех страниц сайта можно удалять нажатием одной кнопки. Анкоры сохраняются.
- Новый параметр ACMS_SAFE_MODE, который запрещает менять настройки Лоадера/CMS и загружать кастомные файлы, у импортов тоже запрещается импортировать настройки и кастомные файлы.
- JSON-файлы настроек Лоадера и CMS теперь можно скачать себе на компьютер и загрузить в CMS из файла на компьютере. Таким образом перенос настроек на другие сайты стал ещё проще.
- Создание кастомных правил стало удобнее, есть часто используемые шаблоны, которые можно выбрать.
- Новые кастомные файлы можно создать в файл менеджере без необходимости загружать файл.
- Дерево урлов для основного домена всегда идёт первым.
- Если вы скрываете дерево урлов для домена/поддомена, то эта настройка сохраняется во время работы с CMS.
- Вместо двух кнопок раскрыть/свернуть дерево урлов, теперь одна, которая умеет и то и другое.
- Создание нового урла упростилось и при создании можно сразу указать файл с компьютера.
- В мобильной вёрстке основная рабочая часть идёт первой.
- После каждой манипуляции с файлом, в базе обновляется его размер.
- Исправлена работа кнопок выборочных откатов истории.
- Исправлено создание новых урлов для поддоменов, которые содержат цифры в названии домена.
2020.02.07
Nowa porcja aktualizacji!
Teraz nie trzeba już nic zmieniać w kodzie źródłowym plików.
- Teraz możesz przesyłać strony na serwer, przesyłając na serwer tylko jeden skrypt z naszego Archivarix CMS.
- Aby zmienić coś w ustawieniach CMS, nie trzeba już otwierać jego kodu źródłowego. Możesz ustawić hasło lub dolne limity bezpośrednio w sekcji Ustawienia.
- Aby połączyć swoje liczniki, moduły śledzące, skrypty niestandardowe, w folderze .content.xxxxxx jest teraz używany osobny folder „obejmuje”. Możesz również przesyłać pliki niestandardowe bezpośrednio przez nowego menedżera plików w CMS. Dodanie liczników i danych analitycznych do wszystkich stron witryny stało się również wygodne i zrozumiałe.
- Importowanie obsługuje nową strukturę plików z ustawieniami i folder „zawiera”.
- Dodano skróty klawiaturowe do pracy w edytorze kodu.

Te i wiele innych ulepszeń w nowej wersji. Moduł ładujący został również zaktualizowany i działa z ustawieniami tworzonymi przez CMS.
2020.01.23
Kolejna mega aktualizacja Archivarix CMS!

Dodano bardzo przydatne narzędzia, które umożliwiają kliknięcie przycisku:
- wyczyść wszystkie zepsute linki wewnętrzne,
- usuń brakujące obrazy,
- ustaw rel = "nofollow" dla wszystkich linków zewnętrznych.

Teraz dodatkowe odzyskiwanie można zaimportować bezpośrednio z samego CMS. Możesz połączyć różne odzyskiwanie w jedną działającą witrynę.

Dla tych, którzy pracują z dużymi witrynami lub używają złego hostingu - wszystkie działania, które wcześniej mogły zostać zatrzymane po przekroczeniu limitu czasu twojego hostingu, zostaną teraz podzielone na części i będą automatycznie kontynuowane aż do ich zakończenia. Chcesz dokonać wymiany w kodzie 500 tysięcy plików? Zaimportować kilka gigabajtów odzyskiwania? Wszystko to jest teraz możliwe na każdym, nawet bardzo tanim hostingu. Limit czasu (domyślnie 30 sekund) można zmienić w parametrze ACMS_TIMEOUT.

Nasz moduł ładujący (index.php) działa teraz zarówno na protokołach http, jak i https, niezależnie od parametrów kompilacji. Możesz wymusić protokół, zmieniając wartość parametru ARCHIVARIX_PROTOCOL.
2020.01.07
Kolejna aktualizacja Archivarix CMS z dodaniem nowej funkcjonalności. Teraz każdą starą stronę można poprawnie przekonwertować na UTF-8 jednym kliknięciem. Filtrowanie wyszukiwania stało się jeszcze lepsze, ponieważ Teraz wyniki można filtrować według typu MIME.
2019.12.20
Wypuściliśmy długo oczekiwaną aktualizację Archivarix CMS. W nowej wersji, oprócz różnych ulepszeń i optymalizacji, dodano bardzo przydatną funkcję do dodatkowego filtrowania wyników wyszukiwania i pełnego wsparcia struktury drzewa adresów URL do odzyskiwania z dużą liczbą plików. Więcej informacji można znaleźć w dzienniku zmian w skrypcie Archivarix CMS .