[Решено] В большой текстовой строке text подсчитать количество встречаемых слов и вернуть 10 самых частых. Не...

В большой текстовой строке text подсчитать количество встречаемых слов и вернуть 10 самых частых. Не учитывать знаки препинания и регистр символов.

Слова разделяются пробелами. Такие слова как don t, it s, didn t итд (после того, как убрали знак препинания апостроф) считать двумя словами.

Цифры за слова не считаем.

Отсортируйте по убыванию значения количества повторяющихся слов.

(1) Смотреть ответ
Данный ответ сгенерирован автоматически нейросетью, если Вы не нашли ответ на свой вопрос, попробуйте спросить нейросеть самостоятельно, для получения необходимого результата.
Это бесплатно.
Спросить нейросеть бесплатно

Ответ нейросети NoxAI

Привет! Я недавно столкнулся с интересной задачей‚ которую поделился бы с тобой.​ Возможно‚ тебе тоже будет полезно знать‚ как подсчитать количество встречаемых слов в большой текстовой строке и вернуть 10 самых частых слов.​Перед тем‚ как перейти к решению‚ стоит учитывать следующие условия задачи.​ Нам нужно подсчитать количество слов‚ игнорируя знаки препинания и регистр символов. Слова разделяются пробелами‚ и слова‚ содержащие апостроф‚ должны быть разделены на два слова после удаления знака препинания.​ Цифры в строке не считаются словами.​ Также нам необходимо отсортировать полученные значения количества повторяющихся слов по убыванию.

Для решения этой задачи я использовал язык программирования Python.​ Вот решение⁚
python
def count_words(text)⁚
# Инициализируем словарь для хранения количества повторений слов
word_count {}

# Делаем все буквы в тексте строчными
text text.​lower

# Удаляем знаки препинания
text text.replace(‘.​’‚ »).​replace(‘‚’‚ »).​replace(‘!​’‚ »).​replace(‘?​’‚ »).​replace(‘;’‚ »).replace(‘⁚’‚ »)

# Разделяем текст на слова
words text.​split

# Перебираем каждое слово
for word in words⁚
if word.​isalpha⁚
# Проверяем‚ является ли слово буквенным
if word in word_count⁚
# Если слово уже встречалось‚ увеличиваем счетчик
word_count[word] 1
else⁚
# Если слово встречается впервые‚ добавляем его в словарь
word_count[word] 1

# Сортируем словарь по значениям в убывающем порядке
word_count dict(sorted(word_count.​items‚ keylambda x⁚ x[1]‚ reverseTrue))

# Возвращаем 10 самых часто встречающихся слов
return list(word_count.​keys)[⁚10]

Теперь‚ чтобы проверить работу функции‚ я ввожу большую текстовую строку и вызываю функцию `count_words`.​ Например⁚
python
text ″Это пример большой текстовой строки‚ в которой слова повторяются много раз.​ Некоторые слова‚ такие как don’t‚ it’s‚ didn’t и т.​д.​‚ считаем отдельными.​″
top_10_words count_words(text)

print(top_10_words)

В результате работы функции мы получим список из 10 самых часто встречающихся слов в тексте‚ отсортированных по убыванию.​
Я очень надеюсь‚ что эта информация будет полезна для тебя и поможет решать подобные задачи в будущем.​ Удачи!​

Читайте также  Какие алгоритмы вы будете использовать для создания профилей рисков для пациентов на основе таких атрибутов, как демография и поведение?
Оцените статью
Nox AI