OpenI
/
AISafety

 
			
							# !/usr/bin/env python
# coding=UTF-8
"""
@Author: WEN Hao
@LastEditors: WEN Hao
@Description:
@Date: 2021-09-17
@LastEditTime: 2022-04-01

预置模型，roberta_dianping
"""

import os
from typing import NoReturn, Optional, Union, Sequence, List

import torch
import numpy as np
import transformers

from ..hf_model import HuggingFaceNLPVictimModel
from utils.misc import nlp_cache_dir
from utils._download_data import download_if_needed


__all__ = [
    "VictimRoBERTaDianPing",
]


class VictimRoBERTaDianPing(HuggingFaceNLPVictimModel):
    """
    2分类模型，中文
    """

    __name__ = "VictimRoBERTaDianPing"

    def __init__(self, path: Optional[str] = None) -> NoReturn:
        """ """
        self._path = path or os.path.join(
            nlp_cache_dir, "roberta-base-finetuned-dianping-chinese"
        )
        if not os.path.exists(self._path):
            # raise ValueError("暂不支持在线下载模型")
            download_if_needed(
                uri="roberta-base-finetuned-dianping-chinese",
                source="aitesting",
                dst_dir=nlp_cache_dir,
                extract=True,
            )
        model = transformers.AutoModelForSequenceClassification.from_pretrained(
            self._path
        )
        tokenizer = transformers.AutoTokenizer.from_pretrained(self._path)
        tokenizer.convert_id_to_word = tokenizer._convert_id_to_token
        super().__init__(model, tokenizer)
        self._pipeline = transformers.pipeline(
            "sentiment-analysis", model=model, tokenizer=tokenizer
        )

    @torch.no_grad()
    def predict(
        self, sentences: Union[str, Sequence[str]], to_label: bool = False
    ) -> Union[int, List[int]]:
        """ """
        if isinstance(sentences, str):
            single_prediction = True
            pred = self([sentences])
        else:
            single_prediction = False
            pred = self(sentences)
        pred = np.argmax(pred.detach().cpu().numpy(), axis=1).tolist()
        if to_label:
            pred = [self.id2label[i] for i in pred]
        if single_prediction:
            pred = pred[0]
        return pred

    @property
    def path(self) -> str:
        return self._path

    def extra_repr_keys(self) -> List[str]:
        return ["path"]