Задание 27. Информатика. ЕГЭ. Апробация. 05.03.2025

Просмотры: 989
Изменено: 6 марта 2025

Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на \(N\) непересекающихся непустых подмножеств (кластеров), таких что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной \(H\) и \(W,\) причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям. Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников. Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости \(A(x_1, \, y_1)\) и \(B(x_2, \, y_2)\) вычисляется по формуле: $$ d(A, \, B) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2} .$$ В файле А хранятся данные о звёздах двух кластеров, где \(H=7, \, W=7\) для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата \(x,\) затем координата \(y.\) Значения даны в условных единицах. Известно, что количество звёзд не превышает \(1000.\) В файле Б хранятся данные о звёздах трёх кластеров, где \(H=8, \, W=8\) для каждого кластера. Известно, что количество звёзд не превышает \(10~000.\) Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: \(P_x\) — среднее арифметическое абсцисс центров кластеров, и \(P_y\) — среднее арифметическое ординат центров кластеров. В ответе запишите четыре числа: в первой строке сначала целую часть произведения \(|P_x| \times 10~000,\) затем целую часть произведения \(|P_y| \times 10~000\) для файла А, во второй строке — аналогичные данные для файла Б. Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющий отношения к заданию. Для выполнения задания используйте данные из прилагаемых файлов.

Файл с данными

Решение:

Python


from math import dist

base = ''

files = ['27_A.txt', '27_B.txt']

for task in (0, 1):
    eps = 1.6
    fd = open(base + files[task])
    fd.readline()
    data = [tuple(map(float, line.replace(',', '.').split())) for line in fd]
    clusters = []
    while data:
        clusters.append([data.pop()])
        for p in clusters[-1]:
            neigh = [pt for pt in data if dist(p, pt) < eps]
            clusters[-1] += neigh
            for pt in neigh:
                data.remove(pt)
    #print(len(clusters), [len(c) for c in clusters])

    centers = []
    for cl in clusters:
        d_min = float('inf')
        c = None
        for p in cl:
            d = sum(dist(p, pt) for pt in cl)
            if d < d_min:
                d_min = d
                c = p
        centers.append(c)
    px = sum(p[0] for p in centers) / len(centers)
    py = sum(p[1] for p in centers) / len(centers)
    #print(centers)
    print(int(abs(px) * 10_000), int(abs(py) * 10_000))

Ответ:
\(28603 \,\, 10294\)
\(61260 \,\, 11206\)