多くの場合、字幕は発せられる言葉の音節に合わせて表示されるようにつくられます。

翻訳字幕を「しゃべっていることの内容がそのまま順に表示されている」という感覚で読めるようにするためには、音声の区切れ目で訳文が切り替わるようにするほうが自然に感じるからです。そのため、声の始まりで表示開始点を取り、声終わりで終了点を取ることが基本となっています。

この、字幕を表示するタイミングと長さを、声の区切れ目をうまく使いながら決めていく作業ことを、字幕制作用語で「ハコ割り(ハコ切り)」といいます。原語と違う内容が表示されることを最大限に利用し表示に最適化した訳文をつくっていく前提だからこそ、このような方法が成り立つわけなのですが、翻訳以外の字幕においては、音の区切りのとおりに字幕を表示していくことが必ずしもよい結果につながるとは限らないこともあるのです。

以前は翻訳者の指定したハコ割り指示を元に、正確なタイムを取るスポッティング作業が別途存在しましたが、最近では翻訳者自身がPC上で字幕制作ソフトウエアを使い、ハコ割り兼スポッティング作業でタイミングデータまでつくってしまうことが一般化しています。

映像作品内で音として発せられる言葉の投げかけのタイミングは、いつの場合も全体構成に影響し、演出意図を含んでいる場合も多いため、とても大切な意味を持っています。ですから音声とシンクロしている字幕の表示タイミングも作品内で重要視する必要があるものなのです。さらに字幕は時間軸上に構築される文字列ですので、しっかりと時間をとらえる=音の頭をとらえていないと、字幕文自体の構築がうまくいかず、頼りなく不自然で読みにくいものになってしまうということを知っておく必要があります。

→声の出るタイミングと字幕の表示開始タイミングを合わせる作業は重要。

字幕を必要としている人は、それを通して作品を見ていると言うことができます。不安定なタイミングや文字内容があれば、その映像作品はどうなるでしょうか?字幕の出来、不出来は作品自体の視聴イメージに直結するのです。