Как вычленить из текста ФИО на python, при том что конкретных шаблонов нет?

Если у вас нет конкретных шаблонов для вычленения ФИО из текста на Python, вы можете использовать различные текстовые процессы и алгоритмы для выполнения данной задачи. Вот несколько шагов, которые могут помочь вам в достижении решения:

Предварительная обработка текста:

Удалите все символы пунктуации и специальные символы из текста.
Преобразуйте текст в нижний регистр, чтобы избежать проблем с регистронезависимостью.
Разделите текст на отдельные слова.

Определение частоты слов:

Создайте словарь для отслеживания частоты каждого слова в тексте.
Пройдите по всем словам в тексте и увеличивайте значения в словаре для каждого встреченного слова.

Определение наиболее вероятных имен:

Определите вероятные имена, исходя из частоты слов. Можете использовать базу данных имен или корпус обучающих данных по именам.
Исключите наиболее распространенные слова, которые скорее всего не являются именами (например, артикли, предлоги и т. д.)

Определение вероятных фамилий:

Используйте аналогичный подход для определения вероятных фамилий, исходя из частоты слов.

Вычленение ФИО:

Пройдитесь по всем словам текста и проверьте, является ли каждое слово именем или фамилией.
Если слово в списке вероятных имен или фамилий, добавьте его в соответствующий список имен или фамилий.
После завершения прохода по всем словам, объедините полученные имена и фамилии, чтобы сформировать полные ФИО.

Доработка и улучшение алгоритма:

Проанализируйте результаты и проведите доработки, если это необходимо.
Попробуйте использовать дополнительные методы, такие как машинное обучение или анализ контекстной информации, чтобы повысить точность определения имен и фамилий.

Обратите внимание, что данный подход не идеален, и может быть неэффективным в некоторых случаях, особенно если у вас есть тексты с неправильными или неполнотой ФИО. Тем не менее, он может быть хорошим начальным шагом для разработки более сложного алгоритма и доработки его с течением времени.