Создайте Планировщик загрузки с небольшим навыком программирования

Оглавление:

Создайте Планировщик загрузки с небольшим навыком программирования
Создайте Планировщик загрузки с небольшим навыком программирования

Видео: Создайте Планировщик загрузки с небольшим навыком программирования

Видео: Создайте Планировщик загрузки с небольшим навыком программирования
Видео: Слайдшоу на Javascript. Pure Javascript Slideshow - YouTube 2024, Май
Anonim

Мы все любим загружать материал из Интернета, и есть куча замечательных инструментов менеджера загрузки, которые мы можем использовать для планирования наших загрузок. Возможно, проще будет использовать диспетчер загрузки, но нет никакого вреда в изучении инструментов, которые уже поставляются с нашим Ubuntu, и полностью использовать его.

В этой статье мы покажем вам встроенное программное обеспечение в Ubuntu, которое мы можем использовать для загрузки материалов из Интернета, используя Wget, Кроме того, мы покажем вам, как планировать загрузку с помощью Cron.

Загрузить с помощью Wget

Wget - это бесплатный программный пакет для извлечения файлов с использованием HTTP, HTTPS и FTP, наиболее широко используемых интернет-протоколов. Это неинтерактивный инструмент командной строки, поэтому его можно легко вызвать из сценариев, заданий cron, терминалов без поддержки X-Windows и т. Д.

Откройте свой терминал и давайте изучим, как мы можем использовать wget для загрузки файлов из сети. Основной синтаксис загрузки с помощью wget заключается в следующем:

wget [option] … …

Эта команда загрузит руководство wget на ваш локальный диск.

wget https://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu поставляется с демоном cron, который используется для планирования задач, которые должны выполняться в определенное время. Crontab позволяет указать действия и время, которое они должны выполнить. Так вы обычно планируете задачу с помощью инструмента командной строки.

Откройте окно терминала и введите crontab -e.

Это основной принцип wget и того, как работает Cron. Давайте возьмем добычу на примере реальной жизни о том, как планировать загрузку.

Планирование загрузки

Мы собираемся загрузить Firefox 3.6 в 2 часа ночи. Поскольку наш интернет-провайдер предоставляет только ограниченный объем данных, нам необходимо остановить загрузку в 8 часов утра. Вот как выглядит установка.

[код] 0 2 * * * wget -c https://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB [/код]

Параметры -c означают, что wget должен возобновить существующую загрузку, если она не была завершена.

Четвертая команда остановит wget в 8 утра. «Killall» - это команда unix, которая убивает процессы по имени.

[код] 0 8 * * * killall wget [/код]

Killall wget сообщает Ubuntu о том, чтобы остановить wget от загрузки файла в 8 часов утра.

Другие полезные команды wget

1. Указание каталога для загрузки файла

[код] wget -output-document = / home / zainul / Downloads / wget manual.pdf https://www.gnu.org/software/wget/manual/wget.pdf [/код]

параметр -output-document позволяет указать каталог и имя загружаемого файла

2. Загрузка веб-сайта

wget также способен загружать веб-сайт.

[код] wget -m https://www.google.com/profiles/zainul.franciscus [/код]

Вышеупомянутая команда загрузит всю мою страницу профиля Google. Опция «-m» сообщает wget загрузить «зеркальное» изображение указанного URL-адреса.

Еще один важный параметр - сообщить wget, сколько ссылок следует использовать при загрузке веб-сайта.

[код] wget -r -l1 https://www.google.com/profiles/zainul.franciscus [/код]

Вышеупомянутая команда wget использует два варианта. Первый параметр «-r» сообщает wget, чтобы загрузить указанный сайт рекурсивно. Второй вариант «-l1» сообщает wget, чтобы получить только первый уровень ссылок с указанного веб-сайта. Мы можем установить до трех уровней «-l2» и «-l3».

3. Игнорирование записи робота

Веб-мастер поддерживает текстовый файл Robot.txt. «Robot.txt» поддерживает список URL, который искатель веб-страниц, такой как wget, не должен сканировать. Мы можем сказать wget игнорировать «Robot.txt» с опцией «-erobots = off». Следующая команда сообщает wget, чтобы загрузить первую страницу моего профиля google и игнорировать «Robot.txt».

[код] wget -erobots = off https://www.google.com/profiles/zainul.franciscus [/код]

Другим полезным вариантом является -U. Этот параметр будет маскировать wget как браузер. Обратите внимание на то, что маскирование приложения как другого приложения может нарушить термин и услугу поставщика веб-услуг.

[код] wget -erobots = off -U Mozilla https://www.google.com/profiles/zainul.franciscus [/код]

Заключение

Wget - очень старый школьный, но взломанный программный пакет GNU, который мы можем использовать для загрузки файлов. Wget - это инструмент интерактивной командной строки, который означает, что мы можем позволить ему работать на нашем компьютере в фоновом режиме без необходимости запуска какого-либо приложения. Проверьте страницу wget man

[код] $ man wget [/код]

чтобы понять другие варианты, которые мы можем использовать с wget.

связи

Руководство Wget Как объединить два загруженных файла, когда wget завершается на полпути Linux QuickTip: загрузка и разгрузка в один шаг

Рекомендуемые: