HTML Parser от More Exercises: Regular Expressions
Здравейте,
Имам проблем, а по успелите на тази задача (само 1 човек), виждам, че не само аз съм така със задачата на този линк:
https://judge.softuni.bg/Contests/Practice/Index/1744#4
По-долу е моето решение, но не минава 1-ви и 3ти тест. Опитах се да добавя какви ли не проверки, но нищо не се променя. Затова разчитам на помощ от колеги.
Предварително благодаря!
import re html_line = input() title_pattern = '(?<=title>).+(?=</title)' body_pattern = '(?<=body>).+(?=</body)' title = re.findall(title_pattern, html_line) y = re.findall(body_pattern, html_line) body_split_pattern = '[<].+?[>]' z = re.split(body_split_pattern, *y) content = "" for s in z: if s != '' and not s.isdigit(): # removing the digits and the empty strings lefts from tags placed one after the other if '\\n' in s: s = " ".join(re.split(r'\\n', s)) # removing the '\n' in the content content += s.strip() + " " print("Title:", "".join(title)) print("Content:", content.strip()) # .strip() to remove the last " "
Мерси!
И много странно, то си е абсолютно грешно, дори за Test string-а, който се сложил най-горе, а той е част от условието. То дава "TelerikAcademyaims to provide free real-world practicaltraining for young people who want to turn intoskillful .NET software engineers." като отговор за Content, което си е грешно.
А за трети тест грешката направо недоумявам как си стигнал до откриването на проблема.
Благодаря ти още веднъж!
По въпроса как съм стигнал - не помня вече (това е било ноември 2019). Сега само проверих, че съм качил решението в Judge шестдесет и един пъти, като от шестия опит нататък борбата е била за тест номер 3..
Благодаря! Докладвано ли е това?