Loading...

Във форума е въведено ограничение, което позволява на потребителите единствено да разглеждат публикуваните въпроси.

markovood avatar markovood 11 Точки

Търся решение 100/100 на 07. HTML Parser от RegEx TechModule 4.0

Здравейте колеги,

Моля ако някой има решение минаващо в judge-а 100/100 да го сподели тъй като успявам да екстрактна контента без таговете ама ми остават едни "\n" с които си нямам представа как да се справя...

Ето моето решение до момента:

using System;
using System.Text.RegularExpressions;

namespace _07._HTML_Parser
{
    public class HTML_Parser
    {
        public static void Main()
        {
            string patternTitle = @"(?<=<title>)[^<]+";
            string html = Console.ReadLine();

            Match match = Regex.Match(html, patternTitle);
            string title = string.Empty;
            if (match.Success)
            {
                title = match.Value;
            }

            string patternBody = @"(?<=<body>)([^<]+).+(?=<\/body>)";
            match = Regex.Match(html, patternBody);
            string body = string.Empty;
            if (match.Success)
            {
                body = match.Value;
            }

            string patternContent = @"<.+?>";
            string content = string.Join(' ', Regex.Split(body, patternContent));

            Console.WriteLine($"Title: {title}");
            Console.WriteLine($"Content: {content}");
        }
    }
}

тук условието: https://softuni.bg/downloads/svn/soft-tech/Sept-2018/common-lectures/08-Regular-Expressions/Regular-Expressions-Regex-Exercise.docx

Тагове:
0
Fundamentals Module 21/11/2018 22:55:06
yotko_kanchev avatar yotko_kanchev 2 Точки

ако само това ти остава : content = content.Replace("\n", "")    :)))  и принт после.

предполагам, че ще ти остава и "\t" някъде ...

0
markovood avatar markovood 11 Точки

Това вече го пробвах - content = content.Replace("\n", "")  и все още 0/100 като така минава само нулевия тест, ще пробвам да извадя с регекс всички white spaces и после да печатам

0
markovood avatar markovood 11 Точки

Пробвах и с това (content = string.Join(' ', Regex.Split(content, @"\s*\\n\s*"));) , но НИЩО все още съм на 0/100

0
Можем ли да използваме бисквитки?
Ние използваме бисквитки и подобни технологии, за да предоставим нашите услуги. Можете да се съгласите с всички или част от тях.
Назад
Функционални
Използваме бисквитки и подобни технологии, за да предоставим нашите услуги. Използваме „сесийни“ бисквитки, за да Ви идентифицираме временно. Те се пазят само по време на активната употреба на услугите ни. След излизане от приложението, затваряне на браузъра или мобилното устройство, данните се трият. Използваме бисквитки, за да предоставим опцията „Запомни Ме“, която Ви позволява да използвате нашите услуги без да предоставяте потребителско име и парола. Допълнително е възможно да използваме бисквитки за да съхраняваме различни малки настройки, като избор на езика, позиции на менюта и персонализирано съдържание. Използваме бисквитки и за измерване на маркетинговите ни усилия.
Рекламни
Използваме бисквитки, за да измерваме маркетинг ефективността ни, броене на посещения, както и за проследяването дали дадено електронно писмо е било отворено.