bazarr/libs/subliminal_patch/providers/assrt.py

# -*- coding: utf-8 -*-
from __future__ import absolute_import
import json
import logging
import os
import re

from babelfish import language_converters
from guessit import guessit
from requests import Session

from subliminal import Movie, Episode, ProviderError, __short_version__
from subliminal.exceptions import AuthenticationError, ConfigurationError, DownloadLimitExceeded, ProviderError
from subliminal_patch.subtitle import Subtitle, guess_matches
from subliminal.subtitle import fix_line_ending
from subliminal_patch.providers import Provider
from subzero.language import Language

logger = logging.getLogger(__name__)

language_converters.register('assrt = subliminal_patch.converters.assrt:AssrtConverter')

server_url = 'https://api.assrt.net/v1'
supported_languages = list(language_converters['assrt'].to_assrt.keys())

def language_contains(subset, superset):
    if subset.alpha3 != superset.alpha3:
        return False
    if superset.country != None and subset.country != superset.country:
        return False
    if superset.script != None and subset.script != superset.script:
        return False
    return True

def search_language_in_list(lang, langlist):
    for l in langlist:
        if language_contains(lang, l):
            return l
    return None

class AssrtSubtitle(Subtitle):
    """Assrt Sbutitle."""
    provider_name = 'assrt'
    guessit_options = {
        'allowed_languages': [ l[0] for l in supported_languages ],
        # 'allowed_countries': [ l[1] for l in supported_languages if len(l) > 1 ],
        'enforce_list': True
    }

    def __init__(self, language, subtitle_id, video_name, session, token):
        super(AssrtSubtitle, self).__init__(language)
        self.session = session
        self.token = token
        self.subtitle_id = subtitle_id
        self.video_name = video_name
        self.release_info = video_name
        self.url = None
        self._detail = None

    def _get_detail(self):
        if self._detail:
            return self._detail
        params = {'token': self.token, 'id': self.id}
        logger.info('Get subtitle detail: GET /sub/detail %r', params)
        r = self.session.get(server_url + '/sub/detail', params=params, timeout=10)
        r.raise_for_status()

        result = r.json()
        sub = result['sub']['subs'][0]
        files = sub['filelist']

        # first pass: guessit
        for f in files:
            guess = guessit(f['f'], self.guessit_options)
            langs = set()
            if 'language' in guess:
                langs.update(guess['language'])
            if 'subtitle_language' in guess:
                langs.update(guess['subtitle_language'])
            if self.language in langs:
                self._defail = f
                return f

        # second pass: keyword matching
        codes = language_converters['assrt'].codes
        for f in files:
            langs = set([ Language.fromassrt(k) for k in codes if k in f['f'] ])
            if self.language in langs:
                self._defail = f
                return f

        # fallback: pick up first file if nothing matches
        return files[0]

    @property
    def id(self):
        return self.subtitle_id

    @property
    def download_link(self):
        detail = self._get_detail()
        return detail['url']

    def get_matches(self, video):
        matches = guess_matches(video, guessit(self.video_name))
        return matches


class AssrtProvider(Provider):
    """Assrt Provider."""
    languages = {Language(*l) for l in supported_languages}
    video_types = (Episode, Movie)

    def __init__(self, token=None):
        if not token:
            raise ConfigurationError('Token must be specified')
        self.token = token

    def initialize(self):
        self.session = Session()
        self.session.headers = {'User-Agent': os.environ.get("SZ_USER_AGENT", "Sub-Zero/2")}

    def terminate(self):
        self.session.close()

    def query(self, languages, video):
        # query the server
        keywords = []
        if isinstance(video, Movie):
            if video.title:
                # title = "".join(e for e in video.title if e.isalnum())
                title = video.title
                keywords.append(title)
            if video.year:
                keywords.append(str(video.year))
        elif isinstance(video, Episode):
            if video.series:
                # series = "".join(e for e in video.series if e.isalnum())
                series = video.series
                keywords.append(series)
            if video.season and video.episode:
                keywords.append('S%02dE%02d' % (video.season, video.episode))
            elif video.episode:
                keywords.append('E%02d' % video.episode)
        query = ' '.join(keywords)

        params = {'token': self.token, 'q': query, 'is_file': 1}
        logger.debug('Searching subtitles: GET /sub/search %r', params)
        res = self.session.get(server_url + '/sub/search', params=params, timeout=10)
        res.raise_for_status()
        result = res.json()

        if result['status'] != 0:
            logger.error('status error: %r', result['status'])
            return []

        # parse the subtitles
        pattern = re.compile(r'lang(?P<code>\w+)')
        subtitles = []
        for sub in result['sub']['subs']:
            if 'lang' not in sub:
                continue
            for key in sub['lang']['langlist'].keys():
                match = pattern.match(key)
                try:
                    language = Language.fromassrt(match.group('code'))
                    output_language = search_language_in_list(language, languages)
                    if output_language:
                        subtitles.append(AssrtSubtitle(output_language, sub['id'], sub['videoname'], self.session, self.token))
                except:
                    pass

        return subtitles

    def list_subtitles(self, video, languages):
        return self.query(languages, video)

    def download_subtitle(self, subtitle):
        r = self.session.get(subtitle.download_link, timeout=10)
        r.raise_for_status()

        subtitle.content = fix_line_ending(r.content)
update deps 2018-10-31 16:08:29 +00:00			`# -- coding: utf-8 --`
WIP 2019-09-17 02:04:27 +00:00			`from __future__ import absolute_import`
update deps 2018-10-31 16:08:29 +00:00			`import json`
			`import logging`
			`import os`
			`import re`

			`from babelfish import language_converters`
			`from guessit import guessit`
			`from requests import Session`

			`from subliminal import Movie, Episode, ProviderError, __short_version__`
			`from subliminal.exceptions import AuthenticationError, ConfigurationError, DownloadLimitExceeded, ProviderError`
			`from subliminal_patch.subtitle import Subtitle, guess_matches`
			`from subliminal.subtitle import fix_line_ending`
			`from subliminal_patch.providers import Provider`
			`from subzero.language import Language`

			`logger = logging.getLogger(__name__)`

			`language_converters.register('assrt = subliminal_patch.converters.assrt:AssrtConverter')`

			`server_url = 'https://api.assrt.net/v1'`
WIP 2019-09-17 02:04:27 +00:00			`supported_languages = list(language_converters['assrt'].to_assrt.keys())`
update deps 2018-10-31 16:08:29 +00:00
Allow assrt to fetch subtitles through only ISO 639-2 This commit should fix issue #460 2019-11-30 10:11:00 +00:00			`def language_contains(subset, superset):`
			`if subset.alpha3 != superset.alpha3:`
			`return False`
			`if superset.country != None and subset.country != superset.country:`
			`return False`
			`if superset.script != None and subset.script != superset.script:`
			`return False`
			`return True`

			`def search_language_in_list(lang, langlist):`
			`for l in langlist:`
			`if language_contains(lang, l):`
			`return l`
			`return None`
update deps 2018-10-31 16:08:29 +00:00
			`class AssrtSubtitle(Subtitle):`
			`"""Assrt Sbutitle."""`
			`provider_name = 'assrt'`
			`guessit_options = {`
			`'allowed_languages': [ l[0] for l in supported_languages ],`
Fix for #1151 2020-10-16 00:08:58 +00:00			`# 'allowed_countries': [ l[1] for l in supported_languages if len(l) > 1 ],`
update deps 2018-10-31 16:08:29 +00:00			`'enforce_list': True`
			`}`

			`def __init__(self, language, subtitle_id, video_name, session, token):`
			`super(AssrtSubtitle, self).__init__(language)`
			`self.session = session`
			`self.token = token`
			`self.subtitle_id = subtitle_id`
			`self.video_name = video_name`
Fix for #1151 2020-10-16 00:08:58 +00:00			`self.release_info = video_name`
update deps 2018-10-31 16:08:29 +00:00			`self.url = None`
			`self._detail = None`

			`def _get_detail(self):`
			`if self._detail:`
			`return self._detail`
			`params = {'token': self.token, 'id': self.id}`
Allow assrt to fetch subtitles through only ISO 639-2 This commit should fix issue #460 2019-11-30 10:11:00 +00:00			`logger.info('Get subtitle detail: GET /sub/detail %r', params)`
update deps 2018-10-31 16:08:29 +00:00			`r = self.session.get(server_url + '/sub/detail', params=params, timeout=10)`
			`r.raise_for_status()`

			`result = r.json()`
			`sub = result['sub']['subs'][0]`
			`files = sub['filelist']`

			`# first pass: guessit`
			`for f in files:`
			`guess = guessit(f['f'], self.guessit_options)`
			`langs = set()`
			`if 'language' in guess:`
			`langs.update(guess['language'])`
			`if 'subtitle_language' in guess:`
			`langs.update(guess['subtitle_language'])`
			`if self.language in langs:`
			`self._defail = f`
			`return f`

			`# second pass: keyword matching`
			`codes = language_converters['assrt'].codes`
			`for f in files:`
			`langs = set([ Language.fromassrt(k) for k in codes if k in f['f'] ])`
			`if self.language in langs:`
			`self._defail = f`
			`return f`

			`# fallback: pick up first file if nothing matches`
			`return files[0]`

			`@property`
			`def id(self):`
			`return self.subtitle_id`

			`@property`
			`def download_link(self):`
			`detail = self._get_detail()`
			`return detail['url']`

			`def get_matches(self, video):`
			`matches = guess_matches(video, guessit(self.video_name))`
			`return matches`


			`class AssrtProvider(Provider):`
			`"""Assrt Provider."""`
			`languages = {Language(*l) for l in supported_languages}`
Implemented some utility functions to subliminal_patch providers to list supported languages and video types. 2021-11-10 03:55:47 +00:00			`video_types = (Episode, Movie)`
update deps 2018-10-31 16:08:29 +00:00
			`def __init__(self, token=None):`
			`if not token:`
			`raise ConfigurationError('Token must be specified')`
			`self.token = token`

			`def initialize(self):`
			`self.session = Session()`
libs: update subliminal_patch to current; revert fixed Bazarr/1 user agent 2019-04-03 13:53:56 +00:00			`self.session.headers = {'User-Agent': os.environ.get("SZ_USER_AGENT", "Sub-Zero/2")}`
update deps 2018-10-31 16:08:29 +00:00
			`def terminate(self):`
			`self.session.close()`

			`def query(self, languages, video):`
			`# query the server`
			`keywords = []`
			`if isinstance(video, Movie):`
			`if video.title:`
Fix for #1151 2020-10-16 00:08:58 +00:00			`# title = "".join(e for e in video.title if e.isalnum())`
			`title = video.title`
Fix for #996 2020-05-23 13:09:21 +00:00			`keywords.append(title)`
update deps 2018-10-31 16:08:29 +00:00			`if video.year:`
			`keywords.append(str(video.year))`
			`elif isinstance(video, Episode):`
			`if video.series:`
Fix for #1151 2020-10-16 00:08:58 +00:00			`# series = "".join(e for e in video.series if e.isalnum())`
			`series = video.series`
Fix for #996 2020-05-23 13:09:21 +00:00			`keywords.append(series)`
update deps 2018-10-31 16:08:29 +00:00			`if video.season and video.episode:`
			`keywords.append('S%02dE%02d' % (video.season, video.episode))`
			`elif video.episode:`
			`keywords.append('E%02d' % video.episode)`
			`query = ' '.join(keywords)`

			`params = {'token': self.token, 'q': query, 'is_file': 1}`
Allow assrt to fetch subtitles through only ISO 639-2 This commit should fix issue #460 2019-11-30 10:11:00 +00:00			`logger.debug('Searching subtitles: GET /sub/search %r', params)`
update deps 2018-10-31 16:08:29 +00:00			`res = self.session.get(server_url + '/sub/search', params=params, timeout=10)`
			`res.raise_for_status()`
			`result = res.json()`

			`if result['status'] != 0:`
Allow assrt to fetch subtitles through only ISO 639-2 This commit should fix issue #460 2019-11-30 10:11:00 +00:00			`logger.error('status error: %r', result['status'])`
update deps 2018-10-31 16:08:29 +00:00			`return []`

			`# parse the subtitles`
WIP 2019-09-18 15:30:46 +00:00			`pattern = re.compile(r'lang(?P<code>\w+)')`
update deps 2018-10-31 16:08:29 +00:00			`subtitles = []`
			`for sub in result['sub']['subs']:`
			`if 'lang' not in sub:`
			`continue`
			`for key in sub['lang']['langlist'].keys():`
			`match = pattern.match(key)`
			`try:`
			`language = Language.fromassrt(match.group('code'))`
Allow assrt to fetch subtitles through only ISO 639-2 This commit should fix issue #460 2019-11-30 10:11:00 +00:00			`output_language = search_language_in_list(language, languages)`
			`if output_language:`
			`subtitles.append(AssrtSubtitle(output_language, sub['id'], sub['videoname'], self.session, self.token))`
update deps 2018-10-31 16:08:29 +00:00			`except:`
			`pass`

			`return subtitles`

			`def list_subtitles(self, video, languages):`
			`return self.query(languages, video)`

			`def download_subtitle(self, subtitle):`
			`r = self.session.get(subtitle.download_link, timeout=10)`
			`r.raise_for_status()`

			`subtitle.content = fix_line_ending(r.content)`