Jak przenieść zawartość z Wayback Machine (archive.org) do Wordpress?

Wysłane przez: 2019-12-04

Korzystając z opcji „Wyciąg z ustrukturyzowanej treści”, możesz łatwo utworzyć blog Wordpress zarówno ze strony znalezionej w archiwum internetowym, jak iz dowolnej innej witryny. Aby to zrobić, najpierw znajdź witrynę źródłową, a następnie w narzędziu "Wznowienie stronę" lub "Pobierz stronę" zaznacz opcję „Wyciąg z ustrukturyzowanej treści”. Wprowadź swoje opcje (e-mail, znaczniki czasu itp.) I rozpocznij pobieranie.


Po zakończeniu procesu pobierania strony system wdraża ją na naszym serwerze i zaczyna wyodrębniać zawartość. Podczas tworzenia archiwum artykułów nasz analizator bierze pod uwagę tylko znaczącą treść, z wyjątkiem zduplikowanych artykułów, elementów sterujących i stron serwisowych, pozostawiając tylko artykuły z zapisanym formatowaniem gotowe do zaimportowania do witryny. Po zakończeniu procesu wyodrębniania artykułów otrzymasz list potwierdzający, otwórz go i pobierz zawartość - przycisk „Artykuły (.zip)”.


Archiwum zip zawiera wyodrębnioną zawartość w różnych formatach, z nich wybierz plik z rozszerzeniem .wxr. Na swojej stronie Wordpress rozpocznij import zawartości - (W panelu administracyjnym Wordpress - Narzędzia - Import - Wordpress - Rozpocznij import).


Jeśli wyodrębniona treść zawiera obrazy, łącza do nich będą zawarte w pliku artykułu. Aby zaimportować je do witryny Wordpress, musisz użyć naszej wtyczki Archivarix External Images Importer. W zakładce wtyczki „Ustawienia pobierania” możesz ustawić parametr „Rozpocznij pobieranie” na „Natychmiast”. Oznacza to, że podczas importowania pliku z artykułami wtyczka natychmiast pobierze wszystkie obrazy zewnętrzne do galerii multimediów Wordpress. Jeśli masz dużo obrazów, możesz użyć importu w tle - na tej samej karcie wybierz „Umieść w kolejce”, a następnie kliknij przycisk „Uruchom przetwarzanie w tle”. Po chwili wszystkie dostępne pliki multimedialne zostaną zaimportowane do Twojej witryny.

Wykorzystanie materiałów artykułu jest dozwolone tylko wtedy, gdy opublikowany jest link do źródła: https://pl.archivarix.com/blog/convert-archiveorg-to-wordpress/

Najnowsze wiadomości:
2019.01.23
Kolejna mega aktualizacja Archivarix CMS!

Dodano bardzo przydatne narzędzia, które umożliwiają kliknięcie przycisku:
- wyczyść wszystkie zepsute linki wewnętrzne,
- usuń brakujące obrazy,
- ustaw rel = "nofollow" dla wszystkich linków zewnętrznych.

Teraz dodatkowe odzyskiwanie można zaimportować bezpośrednio z samego CMS. Możesz połączyć różne odzyskiwanie w jedną działającą witrynę.

Dla tych, którzy pracują z dużymi witrynami lub używają złego hostingu - wszystkie działania, które wcześniej mogły zostać zatrzymane po przekroczeniu limitu czasu twojego hostingu, zostaną teraz podzielone na części i będą automatycznie kontynuowane aż do ich zakończenia. Chcesz dokonać wymiany w kodzie 500 tysięcy plików? Zaimportować kilka gigabajtów odzyskiwania? Wszystko to jest teraz możliwe na każdym, nawet bardzo tanim hostingu. Limit czasu (domyślnie 30 sekund) można zmienić w parametrze ACMS_TIMEOUT.

Nasz moduł ładujący (index.php) działa teraz zarówno na protokołach http, jak i https, niezależnie od parametrów kompilacji. Możesz wymusić protokół, zmieniając wartość parametru ARCHIVARIX_PROTOCOL.
2019.01.07
Kolejna aktualizacja Archivarix CMS z dodaniem nowej funkcjonalności. Teraz każdą starą stronę można poprawnie przekonwertować na UTF-8 jednym kliknięciem. Filtrowanie wyszukiwania stało się jeszcze lepsze, ponieważ Teraz wyniki można filtrować według typu MIME.
2019.12.20
Wypuściliśmy długo oczekiwaną aktualizację Archivarix CMS. W nowej wersji, oprócz różnych ulepszeń i optymalizacji, dodano bardzo przydatną funkcję do dodatkowego filtrowania wyników wyszukiwania i pełnego wsparcia struktury drzewa adresów URL do odzyskiwania z dużą liczbą plików. Więcej informacji można znaleźć w dzienniku zmian w skrypcie Archivarix CMS .
2019.11.27
Wydana została nasza wtyczka Archivarix External Images Importer, która importuje obrazy z witryn stron trzecich, do których linki znajdują się w postach i stronach, do galerii WordPress. Jeśli obraz jest obecnie niedostępny lub usunięty, wtyczka pobiera jego kopię z archiwum internetowego.
2019.11.20
Dodaliśmy nową sekcję naszej witryny - Archivarix Blog . Tam możesz przeczytać przydatne informacje na temat działania naszego systemu i przywracania stron z Archive.org.