Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

GridFTP - это расширение протокола передачи файлов (FTP) для грид-вычислений . [1] Протокол был определен в рамках рабочей группы GridFTP форума Open Grid Forum . [2] [3] [4] Существует несколько реализаций протокола; наиболее широко используется инструмент , предоставляемый Globus Toolkit . [ необходима цитата ]

Цель GridFTP - обеспечить более надежную и высокопроизводительную передачу файлов, например, для передачи очень больших файлов. GridFTP широко используется в крупных научных проектах, таких как Большой адронный коллайдер, во многих суперкомпьютерных центрах и других научных учреждениях.

GridFTP также решает проблему несовместимости между системами хранения и доступа. Раньше каждый поставщик данных делал свои данные доступными по-своему, предоставляя библиотеку функций доступа. Это затрудняло получение данных из нескольких источников, требуя для каждого другого метода доступа и, таким образом, разделяя все доступные данные на разделы. GridFTP обеспечивает единый способ доступа к данным, охватывая функции из всех различных режимов доступа, развивая и расширяя общепринятый стандарт FTP. FTP был выбран в качестве основы для этого из-за его широкого использования и потому, что он имеет четко определенную архитектуру для расширений протокола (которые могут быть обнаружены динамически).

Разработано множество клиентов GridFTP. Особой популярностью пользуется система «программное обеспечение как услуга» Globus Online. [ необходима цитата ]

Особенности GridFTP [ править ]

GridFTP интегрируется с Grid Security Infrastructure , которая обеспечивает аутентификацию и шифрование для передачи файлов с заданными пользователем уровнями конфиденциальности и целостности данных, а также для межсерверной передачи (то, что FTP называет протоколом обмена файлами , FXP).

GridFTP обеспечивает гораздо большее использование полосы пропускания, чем традиционная технология потоков данных, за счет одновременного использования нескольких потоков TCP. [5] Файлы можно загружать по частям одновременно из нескольких источников; или даже в отдельных параллельных потоках из одного и того же источника, который по-прежнему может лучше использовать полосу пропускания. Чередующиеся и чередующиеся передачи, опять же из нескольких или из одного источника, позволяют дополнительно увеличить скорость.

Хотя FTP имеет возможность возобновить прерванную передачу файла с определенной точки в файле, он не поддерживает передачу только определенной части файла. GridFTP позволяет отправлять подмножество файла. Такая функция полезна в приложениях, где для обработки требуются только небольшие участки очень большого файла данных (мотивирующим примером является обработка данных из эксперимента по физике высоких энергий, традиционное использование технологии Grid).

GridFTP обеспечивает отказоустойчивую реализацию FTP для обработки недоступности сети и проблем с сервером. Передачи также могут быть автоматически перезапущены в случае возникновения проблемы.

Базовое TCP-соединение в FTP имеет множество настроек, таких как размер окна и размер буфера. GridFTP позволяет автоматически (или вручную) согласовывать эти настройки, чтобы обеспечить оптимальную скорость и надежность передачи (оптимальные настройки, вероятно, будут разными для больших файлов и для больших групп файлов).

Ссылки [ править ]

  1. ^ Allcock, W .; Bresnahan, J .; Kettimuthu, R .; Линк, М. (2005). «Полосатая структура и сервер Globus GridFTP». Конференция ACM / IEEE SC 2005 (SC'05) . п. 54. DOI : 10,1109 / SC.2005.72 . ISBN 1-59593-061-2.
  2. ^ "Упрощенное управление данными исследований. | Глобус" . www.globus.org . Проверено 9 июня 2020 .
  3. ^ Оллкок, W. (апрель 2003). «GridFTP: Расширения протокола FTP для сети» (PDF) .
  4. ^ Mandrichenko, Игорь (11 июля 2003). «Улучшения протокола GridFTP» (PDF) .
  5. ^ Сарро, Луис Мануэль. (2012). Астростатистика и интеллектуальный анализ данных . Эйер, Лоран, О'Муллейн, Уильям. Дордрехт: Спрингер. ISBN 978-1-4614-3323-1. OCLC  809767631 .