Как достать текст в парсере GO, когда он внутри див-а, но помимо него есть еще много ненужного (подробности внутри)?

Для того, чтобы достать текст в парсере Go, который находится внутри элемента div, но при этом рядом с ним присутствует много ненужного кода, можно использовать различные методы и библиотеки.

Один из способов - это использование регулярных выражений. В Go для работы с регулярными выражениями можно использовать стандартную библиотеку "regexp". С помощью функции FindStringSubmatch можно найти все соответствия регулярному выражению в тексте. В данном случае регулярное выражение должно соответствовать коду внутри элемента div.

Пример кода:

package main

import (
	"fmt"
	"regexp"
)

func main() {
	text := `
		<html>
			<body>
				<div>
					<h1>Заголовок</h1>
					<p>Текст, который нас интересует</p>
				</div>
				<div>
					<h2>Другой заголовок</h2>
					<p>Другой текст</p>
				</div>
			</body>
		</html>
	`

	re := regexp.MustCompile(`<div>(.*?)</div>`)
	match := re.FindStringSubmatch(text)

	if len(match) > 0 {
		fmt.Println(match[1])
	} else {
		fmt.Println("Текст не найден")
	}
}

В этом примере мы установили регулярное выражение <div>(.*?)</div>, которое ищет текст внутри элемента div. Затем функция FindStringSubmatch находит первое соответствие в тексте и возвращает совпавшую строку в качестве результата. Эта строка содержит только текст, который нас интересует.

Если регулярное выражение совпадает с несколькими элементами div, функция FindStringSubmatch найдет первый элемент, который соответствует выражению. Если нужно найти все совпадения, можно использовать функцию FindAllStringSubmatch. Она вернет массив всех совпавших строк.

Учитывайте, что использование регулярных выражений для парсинга HTML может быть не надежным в некоторых случаях. Лучше использовать специализированные библиотеки для парсинга HTML, такие как "golang.org/x/net/html". Эта библиотека позволяет разобрать HTML-документ в структуру дерева и обращаться к элементам по пути, тегу или атрибуту. Подобный подход обеспечивает более строгую проверку и более надежный парсинг HTML.