{Homework - Bookshop System] - Проблем с първи ред на books.txt

MartinBG 4804 Точки

{Homework - Bookshop System] - Проблем с първи ред на books.txt

Понеже изгубих прилично време, борейки се с грешно парсване на данните от 1-ви ред на books.txt файла от домашното, реших да сложа един коментар и тук, за "бъдещите поколения"

Проблемът е, че данните на първи ред на файла, които изглеждат така в Notepad:

1 20/01/1998 27274 15.31 2 Absalom

При прочитане в Java (пробвах различни методи и encodings) стават:

-1 20/01/1998 27274 15.31 2 Absalom

Първият символ не е точно -, но е невалиден и съответно програмата крашва, ако се опитате да преобразувате тази стойност до int (необходим за EditionType enum).

Явно авторите на задачата също са се набили на проблема, но вместо да оправят файла(напр. да сложат header), са решили да го "насметат под килимчето" като са ни предоставили наготово кода, за парсването му:

BufferedReader booksReader = new BufferedReader(new FileReader("books.txt"));
String line = booksReader.readLine();
while((line = booksReader.readLine()) != null){
    String[] data = line.split("\\s+");

Обърнете внимание на ред №2 - там този ред се прочита, но не се обработва.

Имайте това предвид, ако си пишете собствена логика за парсване (try with resources + stream).

Тагове:

01/04/2018 16:23:44 Databases Advanced - Hibernate

lapd87 103 Точки

И при мен го имаше, а и Ванката на упражненията видях че имаше проблеми. Аз копи-пейстнах в нов файл, а единицата я смених. Как обаче оправи после щуротийте с енкодинга? Ванката ги махна на упражненията, а аз повторих :D сега на новото видео обаче гледам че явно трябва да излизат... а и на Иван му излизаха въпреки че ги беше отъркал преди това... явно е правил нещо после... В конфигурационните файлове ли трябва да барам енкодинга и на какво да го сложа? Някакви идеи по въпроса?

01/04/2018 18:59:17 01/04/2018 19:01:01

ZeaLBG 3 Точки

Докато едитваш файла в Notepad++ натискаш на Encoding/Convert to UTF-8 и ще ти тръгне програмата без проблем. Изгубих около час докато разбера от къде идва проблема все пак... След като беше открито на упражнението, не можеше ли да качат ресурсите наново като го оправят?

01/04/2018 19:30:12

lapd87 103 Точки

На ultraedit не намирам такава опция... имам file->conversions-> и там една камара опции които честно казано не мисля че оправят нещата. Можеш ли да пуснеш файла да погледна как изглежда след корекцията при теб?

От новите упражнения виждам че не трябва да се трият както аз го направих, а да си останат. При теб е така нали?

2000    Absalom
A che punto Ã¨ la note
After Many a Summer Dies the Swan
…

01/04/2018 19:39:13

ZeaLBG 3 Точки

Реално файла изглежда по същия начин, просто енкодинга е друг. Ето ти линк за моя https://mega.nz/#!NypilLyJ!4gOFIFlNRu3EuY6giUuhIz2RmE1Q-L84lCO4eAUpc5E

01/04/2018 19:57:45

Покажи всички коментари

MartinBG 4804 Точки

Понеже ми стана интересно, реших да потърся начин за парсване на UTF-8 BOM файлове и стигнах до това решение:

        try (final BufferedReader br = new BufferedReader(new InputStreamReader(
                new FileInputStream("path\\file_name.ext"), "UTF8"))) {

            // if UTF-8 BOM file
            br.mark(4);
            if ('\ufeff' != br.read()) {
                br.reset(); // not the BOM marker
            }

            // read file as normal
        } catch (IOException e) {
            e.printStackTrace();
        }

Накратко - проверява се дали файлът не започва с UTF-8 BOM сигнатурата, и ако е така я скипва, иначе си чете файла нормално.

Идеята е "заета" от тук (коментарите към статията).

01/04/2018 21:26:26 01/04/2018 21:33:28