kako iz html v text

delam file za import, ki rabi bit brez koncnice
zadeva v html je ze kot mora bit, nove vrste dodani presledki(zahteva), stevilke formatirane v pravo obliko... problem je le, ce zadevo shranim npr v test.txt, mi v fajlu ostanejo<br/>,   , ...

rabim pa takole
HDR6,5
3044122BB , ,232.000,138.000,25.000,25BB,35,1,1,1,1,0,0,0,brd1 ,brd2 ,brd3 ,BRD4

se pravi kako dobit file, v katerem bo LE frmatirano besedilo
ki ga npr dobis, ce v brskalniku kopiras besedilo in prilepis v beleznico.

12 odgovorov

Predpostavljam, da delaš v jeziku PHP.

Če imaš vsebino prvotnega fajla (s HTML kodo) shranjeno v $vsebina, predlagam sledeča dva koraka:

// odstranimo HTML kodo, da ostane le vsebina
$vsebina = strip_tags($vsebina);

// odstranimo vse   in podobne packarije
$vsebina = preg_replace("/&#?[a-z0-9]{2,8};/i","",$vsebina);

Verjetno po teh dveh korakih stvar še ne bo povsem končana, ampak boš pa najbrž precej bližje svojemu cilju.

Vso srečo! ;)

6

dobro predpostavljas
html zgeneriram s php,
zanima me ali bo kljub strip_tags vsebina ostala v novi vrsti? (<br/>)

<br/> bi moral zamenjati z \n ce vsebina ne bo ostala v svoji vrsti

3

Če želiš nove vrstice na mestu, kjer so nekoč stali <br />, predlagam, da pred zgoraj omenjena 2 ukaza dodaš še tegale:

// break HTML nadomestimo s prehodom v novo vrstico
$vsebina = str_replace(array("<br />", "<br>", "<br/>"), "\n", $vsebina);

6

hvala fantje za hiter odgovor

Sploh ni problem, radi pomagamo. :)

2

probaj notepad ++ in njegov cleaner ali pa
http://luci.criosweb.ro/scripts/HTMLCleaner/
http://www.fileformat.info/convert/text/htmlcleaner.htm

se nekaj
ce to txt datotekoodprem v notepad++ je tako kot mora bit, TUDI NOVE VRSTE

ce pa isti file odprem v navadni beleznici, pa ni novih vrst???

odvisno kaj uporabis fickota al pa ferrarija :D

s temle se ne bi strinjal, ker ce v beleznici napises text, dodas entre in shranis, ga lahko odpiras s cemerkoli in bo povsod text v novih vrstah