Как ТыТрубко вычисляет контент, защищённый авторскими правами

То, что Youtube легко «вычисляет» защищённую авторскими правами музыку, я знал давно, и несколько соответствующих писем со словами «никаких действий с вашей стороны не требуется» у меня лежат в почтовом ящике. Но недавно, монтируя видео на основе видеоряда из ролика, запрещённого к размещению на Youtube, столкнулся с удивительным: алгоритм определения контента без малого совершенен.

Оригинальный видеоряд был разделён на несколько частей, лишнее удалено, добавлены вставки, изменена контрастность, изменена частота кадров со стандарта NTSC на стандарт PAL, а также размеры кадра. Добавлен счётчик времени. Заменён звуковой  ряд.

И при всех этих изменениях загружаемый файл безошибочно определяется как запрещённый к размещению! Уже в процессе загрузки появляется жёлтый треугольник. Сам я просмотреть файл могу, а вот больше он никому недоступен. Попытка загрузить видеоряд без аудио дала тот же результат, так что очевидно, что «палится» не звуковая составляющая (хотя и она может быть определена как пиратская).

Проведённые изыскания показали, что Youtube проверяет все загружаемые видео, а не выборочно, и не отдельными участками, а от начала до конца, и сверяет с базой закопирайченного материала. Как заявлено на сайте, это как если бы тридцать шесть тысяч человек смотрели в тридцать шесть тысяч мониторов круглосуточно, даже без перерыва на кофе. В общем, снимаю шляпу перед программистами Гугла – поставленную задачу они реализовали на отменном уровне.

Правда, для эксперимента мне удалось загрузить часть искомого материала (длительностью примерно в 20 секунд), и вот уже трое суток на нём не висит злополучного жёлтого треугольника. Видимо, проверка файлов идёт всё-таки не побайтно, а через блоки некоторой длительности. Но это нарушителю режима нераспространения ничего не даёт.

И ещё интересно, что тот самый оригинальный видеоряд размещён на том же Youtube другим пользователем (даже не одним), и там никаких предупреждений не показывается, а сами видео доступны для просмотра пользователями сервиса. Вряд ли люди проплатили за право размещать материал. Разве что некоторые аккаунты избавлены от проверок контент-роботом (не удивлюсь, если это так).