Професионална програма
Loading...
+ Нов въпрос
MartinBG avatar MartinBG 2813 Точки

{Homework - Bookshop System] - Проблем с първи ред на books.txt

Понеже изгубих прилично време, борейки се с грешно парсване на данните от 1-ви ред на books.txt файла от домашното, реших да сложа един коментар и тук, за "бъдещите поколения" laugh

 

Проблемът е, че данните на първи ред на файла, които изглеждат така в Notepad:

1 20/01/1998 27274 15.31 2 Absalom

При прочитане в Java (пробвах различни методи и encodings) стават:

-1 20/01/1998 27274 15.31 2 Absalom

Първият символ не е точно -, но е невалиден и съответно програмата крашва, ако се опитате да преобразувате тази стойност до int (необходим за EditionType enum).

Явно авторите на задачата също са се набили на проблема, но вместо да оправят файла(напр. да сложат header), са решили да го "насметат под килимчето" като са ни предоставили наготово кода, за парсването му:

BufferedReader booksReader = new BufferedReader(new FileReader("books.txt"));
String line = booksReader.readLine();
while((line = booksReader.readLine()) != null){
    String[] data = line.split("\\s+");

Обърнете внимание на ред №2 - там този ред се прочита, но не се обработва.

Имайте това предвид, ако си пишете собствена логика за парсване (try with resources + stream).

Тагове:
1
lapd87 avatar lapd87 102 Точки

И при мен го имаше, а и Ванката на упражненията видях че имаше проблеми. Аз копи-пейстнах в нов файл, а единицата я смених. Как обаче оправи после щуротийте с енкодинга? Ванката ги махна на упражненията, а аз повторих :D сега на новото видео обаче гледам че явно трябва да излизат... а и на Иван му излизаха въпреки че ги беше отъркал преди това... явно е правил нещо после... В конфигурационните файлове ли трябва да барам енкодинга и на какво да го сложа? Някакви идеи по въпроса?

0
01/04/2018 19:01:01
ZeaLBG avatar ZeaLBG 3 Точки

Докато едитваш файла в Notepad++ натискаш на Encoding/Convert to UTF-8 и ще ти тръгне програмата без проблем. Изгубих около час докато разбера от къде идва проблема все пак... След като беше открито на упражнението, не можеше ли да качат ресурсите наново като го оправят?

1
lapd87 avatar lapd87 102 Точки

На ultraedit не намирам такава опция... имам file->conversions-> и там една камара опции които честно казано не мисля че оправят нещата. Можеш ли да пуснеш файла да погледна как изглежда след корекцията при теб? 

От новите упражнения виждам че не трябва да се трият както аз го направих, а да си останат. При теб е така нали?

2000    Absalom
A che punto è la note
After Many a Summer Dies the Swan
…
0
ZeaLBG avatar ZeaLBG 3 Точки

Реално файла изглежда по същия начин, просто енкодинга е друг. Ето ти линк за моя https://mega.nz/#!NypilLyJ!4gOFIFlNRu3EuY6giUuhIz2RmE1Q-L84lCO4eAUpc5E

1
MartinBG avatar MartinBG 2813 Точки

Понеже ми стана интересно, реших да потърся начин за парсване на UTF-8 BOM файлове и стигнах до това решение:

        try (final BufferedReader br = new BufferedReader(new InputStreamReader(
                new FileInputStream("path\\file_name.ext"), "UTF8"))) {

            // if UTF-8 BOM file
            br.mark(4);
            if ('\ufeff' != br.read()) {
                br.reset(); // not the BOM marker
            }

            // read file as normal
        } catch (IOException e) {
            e.printStackTrace();
        }

 

Накратко - проверява се дали файлът не започва с UTF-8 BOM сигнатурата, и ако е така я скипва, иначе си чете файла нормално.

Идеята е "заета" от тук (коментарите към статията).

1
01/04/2018 21:33:28