Besedilna datoteka je datoteka, ki vsebuje le golo besedilo brez dodatnih oznak oziroma značk. Kot zelo preprost primer si predstavljaj besedilno datoteko, ki vsebuje samo nasledje besedilo:
Gori na gori gori.
Če želiš v tovrstni besedilni datoteki poiskati niz »gori«, boš vse tri primere zlahka našel(-la) z ukazom »najdi« (ang. find). Ne boš pa mogel(-la) razlikovati med različnimi pomeni besede (gora, gorenje in zgoraj).
Semantično oziroma pomensko označevanje besedila je najbolj zanesljiv način, da lahko najdemo vse točno določene podatke, ki jih želimo najti z iskanjem. Na primer vse pojavitve samostalnika gora, glagola gorenje ipd.
V besedilu najpogosteje pomensko označujemo osebe, kraje in datume, vendar je mogoče označiti kar koli – citate oziroma navedke, čustva, ekonomske podatke ali hrano – skratka vse, kar nas zanima. Označujemo lahko posamezne besede, besedne zveze ali daljše dele besedila. V nadaljevanju si bomo ogledali, kako označuemo dele besedila, predvsem v smislu predstavitve besedila na spletu.
S pomočjo označevalnih jezikov lahko nedvoumno označimo dele elektronskega dokumenta. Običajno oznake oziroma značke določajo, kako naj bo določen del besedila prikazan oziroma uporabljen ali pa kaj določen del besedila pomeni.
Izvor besedne zveze »označevalni jezik« izhaja iz postopka stavljenja besedila (ang. typesetting) pred tiskom v tiskarni, pri čemer je urednik dele besedila ob robu označil z navodili oziroma pripombami glede oblikovanja in kasneje tudi glede pomena določene vsebine. Ta vidik pomenskega označevanja delov besedila pa je postal bistven pri uporabi označevalnih jezikov.