Geometri Penguraian Naskah: Bagaimana Subtitle dan Supertitle Teater Mendeteksi Dialog
Machine-translated article. If any wording differs, English text prevails.
Sistem subtitle teater modern bergantung pada satu kemampuan penting: deteksi cue yang akurat dari naskah.
Baik menghasilkan supertitle untuk opera, subtitle untuk produksi panggung, atau teks langsung untuk aksesibilitas, sistem harus menentukan dengan andal:
- Siapa yang berbicara
- Kapan sebuah baris dimulai
- Di mana blok dialog muncul dalam naskah
Sekilas, ini terdengar seperti masalah pemrosesan bahasa alami. Dalam praktiknya, tidak demikian. Selama pengembangan SurtitleLive v2, kami menganalisis hampir 100 naskah dari berbagai bahasa dan tradisi teater. Proses itu membawa kami pada kesimpulan yang mengejutkan: Naskah teater bukanlah data linguistik terutama. Ini adalah data spasial.
1. Masalah Naskah Barat: Struktur tanpa Tanda Baca
Naskah teater Inggris yang khas bergantung pada konvensi tata letak daripada tanda baca untuk menentukan peran.
Contoh: Tata letak naskah panggung yang khas
HAMLET Menjadi, atau tidak menjadi: itulah pertanyaannya.
OPHELIA Tuanku, aku punya kenangan tentangmu.
Bagi pembaca manusia, interpretasinya jelas:
| Blok | Interpretasi |
|---|---|
| HAMLET | Nama karakter |
| Teks yang menjorok | Dialog |
| OPHELIA | Nama karakter |
Tetapi untuk pengurai yang hanya melihat teks biasa, strukturnya menghilang. Kita mengenali polanya karena nama karakter muncul dalam SEMUA HURUF BESAR, dialog menjorok, dan blok dipisahkan oleh spasi vertikal. Tata bahasa naskah Barat bersifat tipografi, bukan linguistik.
2. Dari Blok Naskah ke Cue Subtitle
Dalam lingkungan pertunjukan langsung, perangkat lunak subtitle tidak hanya menampilkan teks. Ia harus mengubah naskah menjadi urutan cue subtitle.
Setiap blok dialog yang terdeteksi menjadi cue subtitle yang dapat dipicu selama pertunjukan langsung. Jika pengurai salah mengidentifikasi blok dialog, sistem subtitle akan memicu cue yang salah—kegagalan yang tidak dapat diterima di teater langsung.
3. Tanda Baca vs. Tata Letak: Penemuan Lintas Bahasa
Performa sangat bervariasi tergantung pada ketergantungan bahasa pada penanda eksplisit vs. implisit.
Cina / Kanton: Didorong oleh Tanda Baca
Naskah teater Cina sering kali menyandikan struktur secara eksplisit:
張三:今天下雨。 (Zhang San: Hari ini hujan.) 李四:真的嗎? (Li Si: Benarkah?) (他們望向窗外) ((Mereka melihat ke luar jendela.))
| Pola | Klasifikasi |
|---|---|
| 角色:台詞 (Karakter: Dialog) | Dialog |
| (...) (Tanda kurung) | Arahan panggung |
Struktur yang didorong oleh tanda baca ini membuat penguraian hampir trivial dibandingkan dengan format Barat.
Akurasi Penguraian Komparatif (2026-03)
| Bahasa / Format | Perkiraan Akurasi | Sinyal Struktural Utama | Hambatan Penguraian |
|---|---|---|---|
| Cina / Kanton | ~100% | Tanda baca eksplisit (角色:台詞) | Tidak ada |
| Jepang | ~98% | Penanda kutipan yang stabil | Variasi pemformatan kecil |
| Inggris (AS/Inggris) | ~73% | Struktur tata letak implisit | Indentasi & kapitalisasi |
| Jerman / Prancis | ~71% | Pemformatan teater yang kompleks | Batas blok yang ambigu |
4. Biaya Tersembunyi Mengonversi Naskah ke Teks Biasa
Banyak sistem subtitle memproses naskah dengan terlebih dahulu mengonversi dokumen ke teks biasa, menghilangkan informasi tata letak.
Naskah berformat asli:
HAMLET Menjadi atau tidak menjadi
Setelah konversi teks biasa:
HAMLET Menjadi atau tidak menjadi
Tanpa indentasi atau batas blok, pengurai harus bergantung pada tebakan semantik untuk menentukan apakah "HAMLET" adalah nama karakter atau bagian dari kalimat.
5. Pivot Arsitektur: Penguraian Tata Letak-Pertama
Alih-alih bertanya "Apa arti kalimat ini?", mesin bertanya: "Seperti apa tampilan blok teks ini secara geometris?"
Dengan menggunakan ekstraksi OOXML dari file .docx, kami mengambil atribut tata letak yang tepat seperti indentasi (diukur dalam twips), bendera kapitalisasi, dan gaya paragraf.
Contoh: Sinyal tata letak diekstraksi dari naskah
Blok A:
indent = 72pt,caps_ratio = 1.0,line_length = 8- → Diklasifikasikan sebagai Karakter
Blok B:
indent = 36pt,caps_ratio = 0.2,line_length = 48- → Diklasifikasikan sebagai Dialog
6. Arahan Panggung: Ketika Tipografi Menjadi Struktur
Dalam banyak naskah teater, arahan panggung ditunjukkan murni melalui tipografi—seringkali huruf miring.
Contoh: Tipografi sebagai Struktur
HAMLET Menjadi, atau tidak menjadi.
Dia berhenti dan melihat ke arah penonton.
OPHELIA Tuanku?
| Blok | Interpretasi |
|---|---|
| HAMLET | Nama karakter |
| Kalimat yang menjorok | Dialog |
| Teks miring | Arahan panggung |
Setelah pemformatan menghilang, pengurai tidak dapat membedakan antara dialog dan narasi. Beberapa naskah menggunakan catatan miring yang bahkan lebih minimal:
jeda berpaling
Ini hampir tidak mengandung cue linguistik, mengandalkan 100% pada atribut gaya tipografi seperti italic=true.
7. Model AI Tiga Tingkat untuk Deteksi Cue yang Andal
Kami memposisikan ulang AI sebagai peninjau daripada penebak:
- Tingkat 1 — Aturan Deterministik: Menangani format eksplisit dengan akurasi 100%.
- Tingkat 2 — Tinjauan AI: Bertindak sebagai proofreader untuk memvalidasi klasifikasi yang tidak pasti.
- Contoh:
HAMLET (dengan tenang). Sistem menentukan apakah "(dengan tenang)" adalah arahan panggung atau dialog berdasarkan konteks dokumen.
- Contoh:
- Tingkat 3 — Klasifikasi AI: Klasifikasi penuh untuk wilayah yang sangat ambigu, ditambatkan oleh pola tata letak yang ditemukan di tempat lain dalam dokumen yang sama.
Kesimpulan
Naskah teater tampak sederhana, tetapi maknanya muncul dari organisasi spasial. Dengan beralih dari tebakan semantik ke penguraian tata letak-pertama, SurtitleLive memberikan cue subtitle yang tepat, pada saat yang tepat.
FAQ
T: Apa itu cue subtitle dalam teater? J: Cue subtitle adalah saat ketika baris dialog harus muncul di tampilan subtitle. Deteksi cue membutuhkan identifikasi blok dialog dan transisi pembicara dalam naskah.
T: Bagaimana sistem menangani pemformatan yang tidak konsisten? J: Sistem kami mengelompokkan tata letak yang serupa. Jika profil dokumen berubah, pengurai melakukan Segmentasi Tata Letak untuk menyesuaikan strateginya secara real-time.
T: Mengapa tata letak penting saat mengurai naskah untuk subtitle? J: Banyak naskah menggunakan indentasi dan spasi alih-alih tanda baca untuk menyandikan struktur. Pengurai tata letak-pertama mendeteksi cue lebih andal daripada model semantik saja.