Всем Доброго дня! Алгоритмы видео хостинга. Может кому полезно будет...
YouTube - это не хаотичный хостинг, а сложнейшая система категоризации видеоканалов с тематическими областями таксономии(систематика). YouTube имеет чёткую древообразную структуру, зная семантические азы которой, пользователям данного форума будет намного легче ориентироваться в выборе тематик каналов, правильным наполнением каналов и т.д.
Система не стоит на месте, а постоянно совершенствуется и обновляется. Это я замечаю чуть ли не каждый месяц...
Усовершенствование системы произошло в 2012 году, года был запущен "YouTube-прожектор", который до сих пор продуманно развивается (по моим наблюдениям). Программа "YouTube-прожектор" сама алгоритмически создаёт каналы по темам, имеющим приоритет у аудитории хостинга и генерирует размещение роликов на этих каналах в ограниченных количествах.
Видео пользователей для размещения ссылками в генерированных плейлистах (под темы ) выбирается по определённым приоритетным параметрам. Как пример: Именно по системе алгоритмически созданных каналов, незарегистрированный YouTube - пользователь видит "гид YouTube" и все пользователи видят так называемые "похожие видео". Также происходит и классификация каналов пользователей.
Алгоритм классификации пользовательских каналов работает следующим образом:
1. Как и при классификации видео, системой используются текстовые метаданные. Система производит распределение пользовательских каналов (как и видео)в своей системе, алгоритмически созданных, каналов по тематикам.
2. Система анализирует все ролики канала на предмет соответствия тематики и выявляет долю процентного большинства. Расчёт этой фракции происходит, с учётом анализа вычислений последних 30 суток. Система производит соответствие своего анализа текстовых метаданных и указанную пользователем категорию видеоканала.
Если присутствует существенное несоответствие одной тематике и на канале существует несвязанность тем, то система принимает решение: либо генерировать множественные классификации, либо заносит канал в своеобразный "чёрный список" и определяет его как "нежелательный" на хостинге.
Текстовые метаданные определяются системой только на 8 основных языках (в планах YouTube охватить все языки, т.к. существует программа интернационализации хостинга). Внутри системы существует внутренний классификатор. Система делит каналы на не соответствующие классификациям, на соответствующие... и "Лучшие классифицированные".
Это деление система учитывает при распределении видео по позициям "похожих видео", которые предлагаются для просмотра пользователям. Также на позиции "похожих видео" влияют ещё три аспекта:
1. Число просмотров за последние 30 дней
2. Число подписчиков на канал, также, за последние 30 дней.
3. Приоритет стране США, как имеющей у своих граждан большинства крупнейших YouTube-каналов. ( Расшифровываю: 1. приоритет каналам любого пользователя мира, имеющим подписчиков из США.) Это нужно учитывать, когда продумываете текстовые метаданные. (Да и никто ещё не отменял разницу (в несколько раз) оплаты клика по рекламе россиянином и буржуйским пользователем.)
В систему введено "случайное зерно" в функцию ранжирования самых верхних позиций тематик. Каждый день на верхние позиции попадают разные ролики из определённого ограниченного количества.
Примечание: Система алгоритмически созданных каналов не закрыта от общественности, но имея очень обширную древообразную структура, сложна для поиска нужных тематик обычными пользователями (более 300 категорий). Через поисковики каналы найти невозможно, они доступны только по прямым ссылкам. С Уважением! Олег Н.
YouTube - это не хаотичный хостинг, а сложнейшая система категоризации видеоканалов с тематическими областями таксономии(систематика). YouTube имеет чёткую древообразную структуру, зная семантические азы которой, пользователям данного форума будет намного легче ориентироваться в выборе тематик каналов, правильным наполнением каналов и т.д.
Система не стоит на месте, а постоянно совершенствуется и обновляется. Это я замечаю чуть ли не каждый месяц...
Усовершенствование системы произошло в 2012 году, года был запущен "YouTube-прожектор", который до сих пор продуманно развивается (по моим наблюдениям). Программа "YouTube-прожектор" сама алгоритмически создаёт каналы по темам, имеющим приоритет у аудитории хостинга и генерирует размещение роликов на этих каналах в ограниченных количествах.
Видео пользователей для размещения ссылками в генерированных плейлистах (под темы ) выбирается по определённым приоритетным параметрам. Как пример: Именно по системе алгоритмически созданных каналов, незарегистрированный YouTube - пользователь видит "гид YouTube" и все пользователи видят так называемые "похожие видео". Также происходит и классификация каналов пользователей.
Алгоритм классификации пользовательских каналов работает следующим образом:
1. Как и при классификации видео, системой используются текстовые метаданные. Система производит распределение пользовательских каналов (как и видео)в своей системе, алгоритмически созданных, каналов по тематикам.
2. Система анализирует все ролики канала на предмет соответствия тематики и выявляет долю процентного большинства. Расчёт этой фракции происходит, с учётом анализа вычислений последних 30 суток. Система производит соответствие своего анализа текстовых метаданных и указанную пользователем категорию видеоканала.
Если присутствует существенное несоответствие одной тематике и на канале существует несвязанность тем, то система принимает решение: либо генерировать множественные классификации, либо заносит канал в своеобразный "чёрный список" и определяет его как "нежелательный" на хостинге.
Текстовые метаданные определяются системой только на 8 основных языках (в планах YouTube охватить все языки, т.к. существует программа интернационализации хостинга). Внутри системы существует внутренний классификатор. Система делит каналы на не соответствующие классификациям, на соответствующие... и "Лучшие классифицированные".
Это деление система учитывает при распределении видео по позициям "похожих видео", которые предлагаются для просмотра пользователям. Также на позиции "похожих видео" влияют ещё три аспекта:
1. Число просмотров за последние 30 дней
2. Число подписчиков на канал, также, за последние 30 дней.
3. Приоритет стране США, как имеющей у своих граждан большинства крупнейших YouTube-каналов. ( Расшифровываю: 1. приоритет каналам любого пользователя мира, имеющим подписчиков из США.) Это нужно учитывать, когда продумываете текстовые метаданные. (Да и никто ещё не отменял разницу (в несколько раз) оплаты клика по рекламе россиянином и буржуйским пользователем.)
В систему введено "случайное зерно" в функцию ранжирования самых верхних позиций тематик. Каждый день на верхние позиции попадают разные ролики из определённого ограниченного количества.
Примечание: Система алгоритмически созданных каналов не закрыта от общественности, но имея очень обширную древообразную структура, сложна для поиска нужных тематик обычными пользователями (более 300 категорий). Через поисковики каналы найти невозможно, они доступны только по прямым ссылкам. С Уважением! Олег Н.