KompiuteriaiFailų tipai

Formatas CSV arba Kur įdėti kableliais?

Tarp programų, kurios susiduria, o ne programuotojas, tada pažengęs vartotojas, importuojant duomenis iš vienos programos į kitą nėra neįprasta. Ir gana dažnai reikia importuoti lentelių duomenis, kurių iš tikrųjų buvo išrastas CSV formatas. Dabar buvo sukurta keletas alternatyvių sprendimų (pirma tarp jų yra XML). Tačiau CSV failo kūrimas tam tikrais atvejais yra pats patogiausias sprendimas, o kai kurie - labiausiai probleminiai.

Formato pavadinimas yra iššifruojamas kaip pakeistos vertės, atskirtos kableliais. "Notepad" failas atrodo taip:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (pačioje pabaigoje jums nereikia įdėti ženklo)

"Excel" skaičiuoklėje ar panašiose programose yra tokia:

00 01 02 03
01 15-oji 34 11-asis
16 27-oji 33 06

Bet dabar mes analizavome paprasčiausią atvejį. Problemos prasideda būtent dėl to, kad dėl labai suspausto duomenų pateikimo CSV formatas naudojamas perduoti daug informacijos. Dažniausiai duomenų bazėse yra skirtingų verčių: skaitmeninis, abėcėlinis, abėcėlinis, su tarpeliais ir tt Dažnai dideliuose masyvuose yra klaidų ir, pavyzdžiui, kai kur nors lauke atsiranda papildoma kablelių dalis, visos ląstelės gali pereiti prie vieno.

Apskritai problemas, kylančias importuojant duomenis CSV failo formatu, galima suskirstyti į tris kategorijas:

1 - Neteisingas laukų užpildymas.

2 - Neteisingas duomenų konvertavimas išsaugant failą CSV.

3 - Neteisingas formato atpažinimas pagal importo programą.

Mes jau iš dalies išnagrinėjome pirmąjį atvejį. Siekiant kovoti su problema, būtina numatyti priemones, skirtas įvesties duomenų teisingumui kontroliuoti. Pavyzdžiui, jei jums reikia sukurti adresų sąrašo adresų duomenų bazę, yra specialūs scenarijai, kurie patikrina, ar asmuo įvedė savo el. Laišką pageidaujamu formatu. Jei yra tarpų, kablelių ir kitų duomenų, kurie gali būti klaidingai perskaityti, lauko turinys turi būti pateikiamas kabutėse (vadinamasis kompiuteris).

Antras atvejis yra susijęs su kodavimo pasirinkimu. Dažnai pagal patirtį būtina išsiaiškinti, kokią koduotę pageidauja programos importuotojas. "Windows" sistemoje visame pasaulyje taikomas 1251, taigi, jei šaltinio failas susiduria su Unicode tekstu, jis bus rodomas gavėjo programoje kaip klausimų grandinė. "Excel" galima įrašyti į CSV formatu su skirtingais kodavimo ir skiriamųjų dalių (išskyrus kablelį, skirtuką ir kabliataškę vis dar naudojamas), tačiau geriausia sukurti failą Notepad ++ ar OpenOfficeCalc.

Trečioji byla yra antrosios pasekmės. Istoriškai CSV formatas neturi vieno standarto. Daugelis programų priima ir CSV failus iš TSV (atskyrimo nuo tabulių) ir SCSV (kabliataškio) skirtumų, ypač dėl to, kad failo plėtinys apie tai nepraneša. Šiuo atveju duomenys skaitomi klaidingai ir nepaskirstomi reikiamoje eilėje esančiose ląstelėse. Geriausias patarimas yra sukurti CSV failą savo ranka. Kaip jau minėta, jums reikia naudoti patogų redaktorių.

Programuotojams yra žinoma, kaip sugadinti CSV formatą. Pakanka, kad paprastas vartotojas laikytųsi mūsų rekomendacijų, kaip kurti failą. Mažiausia problema atsiranda, kai failas yra specialiai sukurtas importuoti į konkrečią programą (tai taip pat vyksta kitaip). Lengviau atsižvelgti į visas galimas problemas, kylančias duomenų perdavimo būdais .

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lt.atomiyme.com. Theme powered by WordPress.