2023-02-03

Hugging Face Transformers：Pipeline

Machine Learning

NLP

Hugging Face

Python

Hugging Face Transformers Pipeline

Pipeline Hugging Face Transformers memungkinkan Anda untuk melakukan tugas-tugas NLP hanya dengan beberapa baris kode.

Pipeline secara internal melakukan tiga langkah berikut ketika menerima data teks mentah.

Tokenizer: prapemrosesan dilakukan untuk mengubah data menjadi format input model.
Model: teks input yang telah dikonversi dimasukkan ke dalam model.
Post Processing: hasil inferensi model diproses setelahnya menjadi bentuk yang lebih mudah dikelola untuk keluaran.

Pipeline flow
Behind the pipeline

Cara menggunakan Pipeline

Instal Hugging Face Transformers dengan perintah berikut.

$ pip install transformers

Tentukan nama tugas yang ingin Anda lakukan di pipeline, seperti pipeline("question-answering"). Tugas dapat berupa, misalnya

feature-extraction (get the vector representation of a text)
fill-mask
ner (named entity recognition)
question-answering
sentiment-analysis
summarization
text-generation
translation
zero-shot-classification

Informasi lebih lanjut dapat ditemukan di tautan berikut.

Misalnya, jika Anda ingin melakukan klasifikasi teks, tulis yang berikut ini.

from transformers import pipeline

pipe = pipeline("text-classification")
pipe("This restaurant is awesome")

Hasil berikut ini dikembalikan.

[{'label': 'POSITIVE', 'score': 0.9998743534088135}]

Jika Anda ingin menggunakan model tertentu dari Hub, Anda dapat menghilangkan nama tugas hanya jika model di Hub sudah mendefinisikan tugas tersebut.

from transformers import pipeline

pipe = pipeline(model="roberta-large-mnli")
pipe("This restaurant is awesome")

>> [{'label': 'NEUTRAL', 'score': 0.7313136458396912}]

Anda juga dapat meneruskan daftar untuk masukan.

from transformers import pipeline

pipe = pipeline("text-classification")
pipe(["This restaurant is awesome", "This restaurant is awful"])

>> [{'label': 'POSITIVE', 'score': 0.9998743534088135},
>>  {'label': 'NEGATIVE', 'score': 0.9996669292449951}]

Pipeline khusus juga dapat ditentukan.

class MyPipeline(TextClassificationPipeline):
    def postprocess():
        # Your code goes here
        scores = scores * 100
        # And here

my_pipeline = MyPipeline(model=model, tokenizer=tokenizer, ...)
# or if you use *pipeline* function, then:
my_pipeline = pipeline(model="xxxx", pipeline_class=MyPipeline)

Contoh-contoh Pipeline

Berikut ini adalah contoh tugas NLP.

Zero-shot classification
Text generation
Mask filling

Zero-shot classification

Zero-shot classification adalah tugas yang tidak memerlukan teks berlabel; alih-alih, Anda cukup memberikan label yang ingin Anda klasifikasikan secara langsung ke Pipeline, yang mengembalikan hasil inferensi untuk label tersebut. Memberi anotasi pada teks biasanya memakan waktu dan memerlukan pengetahuan khusus. Zero-shot classification sangat berguna dalam kasus-kasus seperti itu.

Hugging Face Transformers：Pipeline

Hugging Face Transformers Pipeline

Cara menggunakan Pipeline

Contoh-contoh Pipeline

Zero-shot classification

Text generation

Mask filling

Referensi

Hugging Face Transformers：Ikhtisar

Hugging Face Transformers：Model

Ryusei Kakujo