Jak znaleźć wszystkie identyfikatory wideo YouTube w ciągu znaków za pomocą wyrażenia regularnego?

Question

Jak znaleźć wszystkie identyfikatory wideo YouTube w ciągu znaków za pomocą wyrażenia regularnego?

Mam pole tekstowe, gdzie użytkownicy mogą pisać wszystko.

Na przykład:

Lorem Ipsum to po prostu atrapa tekstu. http://www.youtube.com/watch?v=DUQi_R4SgWo druk i skład przemysł. Lorem Ipsum został standardowy tekst w branży od 1500 roku, kiedy nieznany drukarka wzięła kuchnię typu i jajecznica do wyrobu okazu typu książka. Przetrwało nie tylko pięć wieków, ale także skok w elektroniczne skład, Pozostałe zasadniczo bez zmian. http://www.youtube.com/watch?v=A_6gNZCkajU&feature=relmfu Została spopularyzowana w latach 60. Z wydanie arkuszy Letraset zawierające Lorem Ipsum oraz ostatnio z wydawaniem desktopów oprogramowanie jak Aldus PageMaker w tym wersje Lorem Ipsum.

Teraz chciałbym go przeanalizować i znaleźć wszystkie adresy URL filmów YouTube i ich identyfikatory.

Jakiś pomysł, jak to działa?

88

php regex youtube

Author: Peter Mortensen, 2011-04-29

Source

10 answers

Oto metoda, którą kiedyś napisałem dla projektu, który wyodrębnia Klucze wideo YouTube i Vimeo:

/**
 *  strip important information out of any video link
 *
 *  @param  string  link to a video on the hosters page
 *  @return mixed  FALSE on failure, array on success
 */
function getHostInfo ($vid_link)
{
  // YouTube get video id
  if (strpos($vid_link, 'youtu'))
  {
    // Regular links
    if (preg_match('/(?<=v\=)([\w\d-_]+)/', $vid_link, $matches))
      return array('host_name' => 'youtube', 'original_key' => $matches[0]); 
    // Ajax hash tag links
    else if (preg_match('§([\d\w-_]+)$§i', $vid_link, $matches))
      return array('host_name' => 'youtube', 'original_key' => $matches[0]);
    else
      return FALSE;
  }
  // Vimeo get video id
  elseif (strpos($vid_link, 'vimeo'))
  {
    if (preg_match('§(?<=/)([\d]+)§', $vid_link, $matches))
      return array('host_name' => 'vimeo', 'original_key' => $matches[0]); 
    else
      return FALSE;
  }
  else
    return FALSE;
}

Znajdź Wyrażenie regularne, które wyodrębni wszystkie linki z tekstu. Google ci w tym pomoże.
pętla wszystkich linków i wywołanie getHostInfo () dla każdego

10

Author: Christof,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-03-11 02:08:08

Podczas gdy odpowiedź ridgerunnera jest podstawą mojej odpowiedzi, jego nie rozwiązuje wszystkich adresów URL i nie wierzę, że jest do tego zdolny, ze względu na wiele możliwych dopasowań VIDEO_ID w adresie URL YouTube. Mój regex zawiera jego agresywne podejście jako ostateczność, ale najpierw próbuje wszystkich typowych meczów, znacznie zmniejszając możliwość niewłaściwego meczu później w adresie URL.

Ta regex:

/https?:\/\/(?:[0-9A-Z-]+\.)?(?:youtu\.be\/|youtube\.com(?:\/embed\/|\/v\/|\/watch\?v=|\/ytscreeningroom\?v=|\/feeds\/api\/videos\/|\/user\S*[^\w\-\s]|\S*[^\w\-\s]))([\w\-]{11})[?=&+%\w-]*/ig;

Obsługuje wszystkie przypadki pierwotnie wymienione w przykładach ridgerunnerów, plus dowolny adres url, który może się zdarzyć, że sekwencja znaków 11 później w adresie url. ie:

Http://www.youtube.com/watch?v=GUEZCxBcM78&feature=pyv&feature=pyv&ad=10059374899&kw=%2Bwingsuit

Oto próbka robocza, która testuje wszystkie przykładowe adresy URL YouTube:

Http://jsfiddle.net/DJSwc/5/

8

Author: ezwrighter,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-05-01 23:37:56

Try

[^\s]*youtube\.com[^\s]*?v=([-\w]+)[^\s]*

Znajdziesz identyfikatory wideo' w pierwszej grupie przechwytywania. Nie wiem, co to jest ważny identyfikator wideo? W tej chwili sprawdzam v= i chwytam wszystkie -A-Za-z0-9_.

Sprawdziłam to w internecie, tutaj na rubular, z Twoim przykładowym sznurkiem.

2

Author: stema,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2011-04-29 10:06:38

Użycie:

<?php

    // The YouTube URL string

    $youtube_url='http://www.youtube.com/watch?v=8VtUYvwktFQ';

    // Use regex to get the video ID

    $regex='#(?<=v=)[a-zA-Z0-9-]+(?=&)|(?<=[0-9]/)[^&\n]+|(?<=v=)[^&\n]+#';

    preg_match($regex, $youtube_url, $id);

    // Plug that into our HTML
?>

2

Author: Noor Khan,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-03-11 02:10:00

Dobra, zrobiłem własną funkcję. Ale uważam, że to dość nieefektywne. Wszelkie ulepszenia są mile widziane:

function get_youtube_videos($string) {

    $ids = array();

    // Find all URLs
    preg_match_all('/(http|https)\:\/\/[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(\/\S*)?/', $string, $links);

    foreach ($links[0] as $link) {
        if (preg_match('~youtube\.com~', $link)) {
            if (preg_match('/[^=]+=([^?]+)/', $link, $id)) {
                $ids[] = $id[1];
            }
        }
    }
    return $ids;
}

2

Author: n00b,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-03-11 02:10:46

Próbowałem prostego wyrażenia, aby uzyskać tylko videoid:

[?&]v=([^&#]*)

Sprawdź to działa online tutaj w phpliveregex .

1

Author: B L Praveen,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-03-11 02:13:30

Oryginalny plakat zapytał: "chciałbym go przeanalizować i znaleźć wszystkie adresy URL filmów YouTube i ich identyfikatory."Przełączyłem najpopularniejszą odpowiedź powyżej na preg_match i zwróciłem ID wideo i adres URL.

Pobierz adres URL i ID YouTube z posta:

$match[0] = Full URL
$match[1] = video ID

function get_youtube_id($input) {
    $input = preg_match('~https?://(?:[0-9A-Z-]+\.)?(?:youtu\.be/|youtube(?:-nocookie)?\.com\S*[^\w\s-])([\w-]{11})(?=[^\w-]|$)(?![?=&+%\w.-]*(?:[\'"][^<>]*>|</a>))[?=&+%\w.-]*~ix',
                        $input, $match);
    return $match;
}

1

Author: Lee Woodman,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-03-11 02:15:43

Znajdź link z YouTube łatwo z ciągu:

function my_url_search($se_action_data)
{
    $regex = '/https?\:\/\/[^\" ]+/i';
    preg_match_all($regex, $se_action_data, $matches);
    $get_url=array_reverse($matches[0]);
    return array_unique($get_url);
}
echo my_url_search($se_action_data)

0

Author: Mukesh Kumar Bijarniya,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-03-11 02:12:18

String urlid="" ;
String  url="http://www.youtube.com/watch?v=0zM4nApSvMg#t=0m10s";
Pattern pattern =Pattern.compile("(?:http|https|)(?::\\/\\/|)(?:www.|)(?:youtu\\.be\\/|youtube\\.com(?:\\/embed\\/|\\/v\\/|\\/watch\\?v=|\\/ytscreeningroom\\?v=|\\/feeds\\/api\\/videos\\/|\\/user\\\\S*[^\\w\\-\\s]|\\S*[^\\w\\-\\s]))([\\w\\-\\_]{11})[a-z0-9;:@#?&%=+\\/\\$_.-]*");
Matcher result = pattern.matcher(url);
    if (result.find())
    {
         urlid=result.group(1);

    }

Ten kod w Javie działa absolutnie dobrze dla wszystkich adresów URL youtube w chwili obecnej.

0

Author: Sravya Singh,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-02-26 16:00:31

score 280 · Accepted Answer

[30]} adres URL filmu YouTube może być spotykany w różnych formatach: [31]}

ostatni krótki format: http://youtu.be/NLqAF9hrVbY
iframe: http://www.youtube.com/embed/NLqAF9hrVbY
iframe (secure): https://www.youtube.com/embed/NLqAF9hrVbY
obiekt param: http://www.youtube.com/v/NLqAF9hrVbY?fs=1&hl=en_US
obiekt embed: http://www.youtube.com/v/NLqAF9hrVbY?fs=1&hl=en_US
oglądaj: http://www.youtube.com/watch?v=NLqAF9hrVbY
użytkownicy: http://www.youtube.com/user/Scobleizer#p/u/1/1p3vcRhsYGo
ytscreeningroom: http://www.youtube.com/ytscreeningroom?v=NRHVzbJVx8I
any / thing / goes!: http://www.youtube.com/sandalsResorts#p/c/54B8C800269D7C1B/2/PPS-8DMrAn4
any / subdomain / too: http://gdata.youtube.com/feeds/api/videos/NLqAF9hrVbY
więcej paramów: http://www.youtube.com/watch?v=spDj54kf-vY&feature=g-vrec
zapytanie może mieć kropkę: http://www.youtube.com/watch?v=spDj54kf-vY&feature=youtu.be
nocookie domain: http://www.youtube-nocookie.com

Tutaj znajduje się funkcja PHP z komentowanym regex, który dopasowuje każdy z tych formularzy URL i konwertuje je na linki (jeśli nie są jeszcze linkami):

// Linkify youtube URLs which are not already links.
function linkifyYouTubeURLs($text) {
    $text = preg_replace('~(?#!js YouTubeId Rev:20160125_1800)
        # Match non-linked youtube URL in the wild. (Rev:20130823)
        https?://          # Required scheme. Either http or https.
        (?:[0-9A-Z-]+\.)?  # Optional subdomain.
        (?:                # Group host alternatives.
          youtu\.be/       # Either youtu.be,
        | youtube          # or youtube.com or
          (?:-nocookie)?   # youtube-nocookie.com
          \.com            # followed by
          \S*?             # Allow anything up to VIDEO_ID,
          [^\w\s-]         # but char before ID is non-ID char.
        )                  # End host alternatives.
        ([\w-]{11})        # $1: VIDEO_ID is exactly 11 chars.
        (?=[^\w-]|$)       # Assert next char is non-ID or EOS.
        (?!                # Assert URL is not pre-linked.
          [?=&+%\w.-]*     # Allow URL (query) remainder.
          (?:              # Group pre-linked alternatives.
            [\'"][^<>]*>   # Either inside a start tag,
          | </a>           # or inside <a> element text contents.
          )                # End recognized pre-linked alts.
        )                  # End negative lookahead assertion.
        [?=&+%\w.-]*       # Consume any URL (query) remainder.
        ~ix', '<a href="http://www.youtube.com/watch?v=$1">YouTube link: $1</a>',
        $text);
    return $text;
}

; / / End $YouTubeId.

A oto wersja JavaScript z dokładnie tym samym regex (z usuniętymi komentarzami):

// Linkify youtube URLs which are not already links.
function linkifyYouTubeURLs(text) {
    var re = /https?:\/\/(?:[0-9A-Z-]+\.)?(?:youtu\.be\/|youtube(?:-nocookie)?\.com\S*?[^\w\s-])([\w-]{11})(?=[^\w-]|$)(?![?=&+%\w.-]*(?:['"][^<>]*>|<\/a>))[?=&+%\w.-]*/ig;
    return text.replace(re,
        '<a href="http://www.youtube.com/watch?v=$1">YouTube link: $1</a>');
}

Uwagi:

część VIDEO_ID adresu URL jest przechwytywana w jedynej grupie przechwytywania: $1.
jeśli wiesz, że Twój tekst nie zawiera żadnych wstępnie połączonych adresów URL, możesz bezpiecznie usunąć twierdzenie negative lookahead, które sprawdza ten warunek (twierdzenie zaczynające się od komentarza: " Assert URL nie jest wstępnie połączone.") to nieco przyspieszy Wyrażenie regularne.
łańcuch zastępczy można zmodyfikować tak, aby pasował do niego. Ten podany powyżej po prostu tworzy link do ogólnego adresu URL stylu "http://www.youtube.com/watch?v=VIDEO_ID" i ustawia tekst linku na: "YouTube link: VIDEO_ID".

Edit 2011-07-05: Dodano - myślnik do klasy ID char

Edit 2011-07-17: Naprawiono regex, aby pochłonąć pozostałą część (np. zapytanie) adresu URL po ID YouTube. Dodano 'i' ignoruj-wielkość liter modyfikator. Zmieniono nazwę funkcji na camelCase. Poprawiono wstępnie połączony test lookahead.

Edycja 2011-07-27: Dodano nowe formaty" user "i" ytscreeningroom " adresów URL YouTube.

Edytuj 2011-08-02: uproszczone/uogólnione do obsługi nowych adresów URL YouTube "any/thing/goes".

Edytuj 2011-08-25: kilka modyfikacji:

dodano wersję Javascript funkcji: linkifyYouTubeURLs().
poprzednia wersja miała opcjonalną część scheme (protokół HTTP) i tym samym pasowała do nieprawidłowych adresów URL. Wykonane część programu wymagane.
poprzednia wersja używała kotwicy \b wokół identyfikatora VIDEO_ID. Jednak to nie zadziała, jeśli rozpocznie się VIDEO_ID lub kończy się kreską -. Naprawiono tak, aby spełniał ten warunek.
zmieniono wyrażenie VIDEO_ID tak, że musi mieć dokładnie 11 znaków.
poprzednia wersja nie wykluczała wstępnie połączonych adresów URL, jeśli miał ciąg zapytania następujący po VIDEO_ID. Poprawiono twierdzenie o negatywnym wyglądzie, aby to naprawić.
Dodano + i % do łańcucha zapytania odpowiadającego klasie znaków.
zmieniono ogranicznik regex wersji PHP z: % na a: ~.
Dodano sekcję "notatki" z przydatnymi notatkami.

Edit 2011-10-12: część hosta URL YouTube może teraz mieć dowolną subdomenę (nie tylko www.).

Edit 2012-05-01: sekcja consume URL może teraz zezwalać na' -'.

Edycja 2013-08-23: dodano dodatkowy format dostarczony przez @ Mei. (Część zapytania może mieć . kropkę.

Edycja 2013-11-30: dodano dodatkowy format dostarczony przez @ CRONUS: youtube-nocookie.com.

Edit 2016-01-25: Naprawiono regex do obsługi przypadku błędu dostarczonego przez CRONUSA.