DH Edu
이동: 둘러보기, 검색


← 메인 페이지

서울시 대규모 공연장
데이터베이스 구축 및 활용 방안 연구


-5,000석 이상 공연장을 중심으로 공연장 최적화 선택 분석-




스위프트입실와조: JJE24KU, SWJ24KU, KJY24KU, HJD24KU, JHW24KU





목차

연구 목적


본 연구는 한국의 문화적 위상이 높아짐에 따라 증가하는 대규모 공연 수요에 비해, 적절한 공연장 정보와 인프라가 부족한 현실적 문제를 해결하고자 한다. 구체적인 목적은 다음과 같다.

첫째, 서울시 소재 5,000석 이상 대규모 공연장에 대한 종합적 데이터베이스를 구축한다. 공연장의 기본 정보(좌석 수, 위치, 개관연도), 운영 정보(운영기관, 대관료), 접근성(주차장, 주변 지하철)과 함께 각 공연장에서 진행된 공연 이력과 패턴을 체계적으로 정리한다.

둘째, 공연장과 공연 간의 상호적합성을 분석한다. 각 공연장에서 진행된 공연들의 공연자와 그 장르별 특성을 분석하여, 특정 유형의 공연이 어떤 공연장 특성과 높은 적합성을 보이는지 도출한다.

셋째, 이를 통해 공연 기획자들이 공연의 성격과 규모에 최적화된 공연장을 효율적으로 선택할 수 있는 실용적 지침을 제공한다. 이는 궁극적으로 공연의 성공적 운영과 관객 만족도 향상에 기여할 것으로 기대된다.

이러한 연구는 서울시 공연 인프라의 효율적 활용을 촉진하고, 나아가 국제적 수준의 공연 문화 발전을 위한 기초 자료로 활용될 것이다.


연구 대상


본 연구는 서울에 위치한 5000석 이상의 공연장을 대상으로 하며, KOPIS 공연예술 통합전산망과 Play DB의 데이터를 활용한다. 시간적 범위는 2018년, 2019년, 2023년, 2024년으로, 코로나19의 영향을 받은 2020년부터 2022년까지는 제외한다.

공연장 정보
기본 정보: 이름, 면적, 좌석 수, 개관연도, 운영기관
시설 특성: 야외/실내 여부, 리모델링 여부
운영 정보: 대관료, 본래 용도
접근성: 주변 주차장 수, 지하철과의 거리, 주소 및 좌표

공연 정보
공연 일시, 티켓 가격

공연자 정보
국적, 직업

이러한 데이터들은 공연장-위치, 아티스트-장르, 공연-아티스트, 공연 장르, 공연장-공연의 관계성을 중심으로 분석되어, 각 공연장의 특성과 공연 패턴을 파악하는 데 활용된다. 이를 통해 공연장별 특성과 적합한 공연 유형을 도출하여 공연 기획자들에게 실질적인 데이터를 제공하고자 한다. 자세한 내용은 후엨 클래스와 속성, 릴레이션 설명에서 서술하겠다.

연구 방법


본 연구는 다음과 같은 단계로 진행된다:

  1. 데이터 수집 및 정제
    • KOPIS와 Play DB에서 공연장, 공연, 공연자 관련 데이터 수집
    • 수집된 데이터를 공연장, 공연, 공연자, 장르, 위치의 클래스로 분류하여 정제
    • 각 클래스별 세부 속성 정보 구조화

  2. 그래프 데이터베이스 구축
    • Neo4j를 활용하여 데이터 간의 관계성 파악
    • 공연장-위치, 아티스트-장르, 공연-아티스트, 공연 장르, 공연장-공연 간의 관계 정의 및 연결
    • 온톨로지 기반 데이터 간 연결 관계 구축

  3. 관계형 데이터 분석
    • 구축된 그래프 데이터베이스를 기반으로 공연장별 특성 분석
    • 공연장과 공연 유형 간의 연관성 파악
    • 공연자 특성과 공연장 선호도 간의 관계 분석
    • 시기별, 장르별 공연장과 공연 패턴 도출

이러한 방법을 통해 공연장과 공연 간의 최적 매칭을 위한 실증적 데이터를 도출하고, 이를 체계화하여 공연 기획자들이 활용할 수 있는 형태로 정리한다.

온톨로지(Ontology)


온톨로지 그래프(OntoGraph)



클래스(Class)

클래스명 한글명 설명
Venue 공연장 공연장명과 특성
Location 위치 공연장 위치
Performance 공연 공연
Genre 장르 공연 및 아티스트 장르
Artist 아티스트 공연자



릴레이션(Relation)

영문명 한글명 정의역 치역 설명
isLocatedIn ~에 위치하다 Venue Location 공연장의 위치
hosts ~를 개최하다 Venue Performance 공연장 개최 공연
belongsTo ~의 장르에 속하다 Performance Genre 공연 장르
features ~가 등장한다 Performance Artist 공연 아티스트
isPartOf ~의 일부이다 Location Location 공연장의 위치
performs ~을 공연한다 Artist Genre 아티스트의 주 장르



속성(Attribute)

Venue 속성

속성명 한글명 설명
gid 식별자 개별 노드의 식별자
class 클래스 개별 노드가 속하는 클래스
name 대표명 개별 노드의 대표명
refurl 참고 웹 자원 개별 노드의 정보에 대해 참고할 수 있는 웹 자원
area 면적 공연장 연면적, 경기장의 경우 경기장 면적 포함
seats 좌석수 공연장의 좌석수
year 개관연도 공연장의 개관연도
organization 운영기관 공연장의 운영기관
orgfeature 민간/공공 공연장 운영기관 민간, 공공 여부
inOut 실내/실외 공연장의 실내외여부
wdfee 주말 대관료 공연장의 대관료 최솟값과 최댓값 중간
hdfee 휴일 대관료 공연장의 대관료 최솟값과 최댓값 중간
ticketfee 티켓fee 공연장의 대관 시 티켓 총수익에서 받는 비용의 비율
opurpose 본래 용도 공연장의 본래 용도, 체육시설과 문화시설로 구분
parking 주차장 공연장 위경도 기준 반경 500m 주차장 개수
subway 지하철역 공연장 위경도 기준 가장 가까운 지하철역
subkm 지하철 공연장 위경도 기준 가장 가까운 지하철역 입구와의 거리
address 주소 공연장의 주소
latitude 위도 해당 주소의 위도
longitude 경도 해당 주소의 경도
remodeling 리모델링 리모델링 여부, 했을 경우 마지막 리모델링 연도


Location 속성

속성명 한글명 설명
gid 식별자 개별 노드의 식별자
class 클래스 개별 노드가 속하는 클래스
name 대표명 개별 노드의 대표명
refurl 참고 웹 자원 개별 노드의 정보에 대해 참고할 수 있는 웹 자원
type 행정구역 장소의 행정구역 상 분류


Performance 속성

속성명 한글명 설명
gid 식별자 개별 노드의 식별자
class 클래스 개별 노드가 속하는 클래스
name 대표명 개별 노드의 대표명
refurl 참고 웹 자원 개별 노드의 정보에 대해 참고할 수 있는 웹 자원
sdate 공연 일자 공연이 시작한 날짜
edate 공연 일자 공연이 끝난 날짜
minprice 티켓가격 공연의 최소 티켓 가격
maxprice 티켓가격 공연의 최대 티켓 가격


Artist 속성

속성명 한글명 설명
gid 식별자 개별 노드의 식별자
class 클래스 개별 노드가 속하는 클래스
name 대표명 개별 노드의 대표명
refurl 참고 웹 자원 개별 노드의 정보에 대해 참고할 수 있는 웹 자원
origin 국내/해외 국내 가수인지 해외 가수인지 여부
job 직업 아티스트의 직업
type 종류 아티스트가 개인인지 팀인지 여부


Genre 속성

속성명 한글명 설명
gid 식별자 개별 노드의 식별자
class 클래스 개별 노드가 속하는 클래스
name 대표명 개별 노드의 대표명
refurl 참고 웹 자원 개별 노드의 정보에 대해 참고할 수 있는 웹 자원



데이터 샘플링




연구 데이터


【데이터 시트 페이지로 이동】


노드 데이터(총 1375건)

  • Venue 17건
  • Performance 353건
  • Location 19건
  • Artist 968건
  • Genre 18건

링크 데이터(총 3394건)

  • V-L (Venue-Location) 17건
  • A-G (Artist-Genre) 874건
  • L-L (Location-Location) 10건
  • P-A (Performance-Artist) 1787건
  • P-G (Performance-Genre) 353건
  • V-P (Venue-Performance) 353건



연구 결과




공연장 전자 지도







1. 공연장의 특성이 공연에 미치는 영향



(1) 공연장별 공연 횟수


MATCH (v:Venue)

OPTIONAL MATCH (v)-[:hosts]->(p:Performance)
RETURN v.name AS 공연장명,
COUNT(p) AS 공연횟수
ORDER BY 공연횟수 DESC

MATCH (v:Venue) OPTIONAL MATCH (v)-[:hosts]->(p:Performance) RETURN v.name AS 공연장명, COUNT(p) AS 공연횟수 ORDER BY 공연횟수 DESC



일부 공연장에 공연이 쏠려 있는 현상이 확인되었다.
-> 그 원인을 살펴보기 위하여 다음 5가지 항목을 분석하였다.

  1. 실내/실외에 따른 공연 횟수 차이
  2. 개관연도와 공연 수 사이의 상관관계 확인
  3. 공연장의 본래 설립 목적과 공연 횟수의 관계
  4. 공연장의 좌석 수와 공연 횟수의 관계
  5. 공연장의 접근성과 공연 횟수의 관계



(2) 실내/실외에 따른 공연 횟수 차이


MATCH (v:Venue)-[:hosts]->(p:Performance)

WITH v.inout AS venue_type, COUNT(p) AS performance_count
WHERE venue_type IN ['in', 'out']  // 'in'은 실내, 'out'은 실외
RETURN venue_type AS 공연장종류, performance_count AS 공연횟수
ORDER BY 공연장종류

MATCH (v:Venue)-[:hosts]->(p:Performance) WITH v.inout AS venue_type, COUNT(p) AS performance_count WHERE venue_type IN ['in', 'out']  // 'in'은 실내, 'out'은 실외 RETURN venue_type AS 공연장종류, performance_count AS 공연횟수 ORDER BY 공연장종류


실내 공연장(in)의 공연 횟수가 293회로, 실외 공연장(out)의 60회보다 압도적으로 많았다.

공연장별 실내/실외 공연 횟수


MATCH (v:Venue)

OPTIONAL MATCH (v)-[:hosts]->(p:Performance)
   WITH v.name AS 공연장명, v.inout AS venue_type, COUNT(p) AS performance_count
   WHERE venue_type IN ['in', 'out']  // 'in'은 실내, 'out'은 실외
   RETURN 공연장명, venue_type AS 공연장종류, performance_count AS 공연횟수
   ORDER BY 공연장종류, 공연장명

실내실외2.png


실내 공연장이라고 무조건 공연 횟수가 많고, 실외 공연장이라고 무조건 공연 횟수가 적은 것은 아니었다.
그러나 실내 공연장 10개 중 6개의 공연 횟수가 10건 이상이고, 실외 공연장 7개 중 단 2개만 공연 횟수가 10건 이상인 것을 보면
실내/실외 여부가 공연 쏠림 현상과 관계가 있음을 짐작해볼 수 있었다.


(3) 개관연도와 공연 수 간의 상관관계


공연장의 노후화가 실제 공연이 이루어지는 데 영향을 미치는지 확인하고자 개관연도와 공연 수 간의 상관관계를 알아보는 쿼리를 실행해 보았다.

MATCH (v:Venue)

OPTIONAL MATCH (v)-[:hosts]->(p:Performance)
   WITH v.year AS 개관연도, v.name AS 공연장명, COUNT(p) AS 공연수
   RETURN 개관연도, 공연장명, 공연수
   ORDER BY 개관연도 ASC

개관연도.png


오래된 공연장일수록 시설이 낙후되어 공연이 적을 것이라고 생각했지만, 개관연도와 공연 수 간의 일관된 패턴을 찾을 수 없었다.
리모델링 여부가 영향을 미쳤을 가능성을 고려하여, 리모델링 연도를 포함하여 쿼리를 재실행해 보았다.

개관연도2.png



그러나 여전히 개관연도 혹은 리모델링 여부와 관련된 패턴을 찾아낼 수는 없었다. 운영 지침, 대관의 용이성 등 공연장과 관련된 다른 이유들이 더욱 크게 작용할 것임을 확인하였다.

(4) 공연장의 본래 목적과 공연 횟수의 관계


MATCH (v:Venue)

OPTIONAL MATCH (v)-[:hosts]->(p:Performance)
   WITH v.name AS 공연장명, v.opurpose AS 본래용도, COUNT(p) AS 공연수
   RETURN 공연장명, 본래용도, 공연수
   ORDER BY 공연수 DESC

본래용도.png


공연장 본래 용도에 따른 유의미한 공연 수 차이는 발견할 수 없었다.
가장 많은 공연을 개최한 공연장 상위 4 곳, 그리고 하위 4곳 중 2곳이 모두 체육시설이었다.
체육시설과 문화시설의 전반적인 공연 수 차이를 알아보기 위하여, 시설별 평균 공연 수를 계산해 보았다.

본래용도2.png


문화 목적으로 설계된 공연장이 체육시설보다 공연 수가 더 많을 것이라고 생각했으나, 실제로는 반대였다.

(5) 공연장의 좌석 수와 공연 횟수의 관계


MATCH (v:Venue)

OPTIONAL MATCH (v)-[:hosts]->(p:Performance)
   WITH v.name AS 공연장, v.seats AS 좌석수, COUNT(p) AS 공연수
   RETURN 공연장, 좌석수, 공연수
   ORDER BY 좌석수 DESC

좌석수.png


좌석수가 10000석 이상 20000석 미만인 공연장들에 특히 공연이 몰려 있었다.
또한, 10000석 미만 공연장 중에서는 고려대학교 화정체육관 주경기장, 올림픽공원 SK핸드볼경기장의 공연 횟수가 두드러지게 나타났다.


(6) 공연장의 접근성과 공연 횟수의 관계


① 지하철역까지의 거리와 공연 횟수의 관계


MATCH (v:Venue)-[:hosts]->(p:Performance)

WITH v, COUNT(p) AS PerformanceCount
RETURN v.name AS VenueName,
  v.subkm AS SubwayDistance,
  PerformanceCount
ORDER BY SubwayDistance ASC, PerformanceCount DESC

지하철역거리.png


지하철역까지의 거리와 공연 수 사이에 유의미한 상관관계는 나타나지 않았다.

② 인근 주차장 수와 공연 수의 관계


MATCH (v:Venue)-[:hosts]->(p:Performance)

WHERE v.parking IS NOT NULL
WITH v.name AS 공연장명, v.parking AS 주차장_수, count(p) AS 공연_건수
RETURN 공연장명, 주차장_수, 공연_건수
ORDER BY 주차장_수 DESC

주차장수.png


마찬가지로, 주차장 수와 공연 수 사이에 유의미한 상관관계는 나타나지 않았다.
오히려 주차장 수가 적은 공연장에서 많은 공연이 열렸다는 점을 고려할 때, 해당 공연장이 자체적으로 주차장을 보유하고 있는지, 보유했다면 주차 가능 대수가 얼마나 되는지 등을 추가적으로 분석할 필요가 있다.


(7) 결론


분석 결과, 공연 쏠림 현상의 가장 큰 원인은 '공연장의 좌석 수'임을 확인할 수 있었다.
좌석 수가 10000석 이상 20000석 미만인 공연장에 공연이 가장 많이 몰려 있다는 특징이 발견되었는데, 해당 규모는 대규모 관객 수용이 가능하면서도 너무 부담스럽지 않은 정도의 규모로 보인다.

좌석수가 10000석 이상 20000석 미만인 공연장에는 아래 5가지가 있다.

좌석수2.png


문화비축기지를 제외한 4개의 공연장에서는 공연이 상당히 활발하게 일어나고 있음을 확인할 수 있다.
우리는 문화비축기지에서 공연이 한 건도 일어나지 않은 점에 주목하여, 그 이유를 파악하고자 했다.

문화비축기지.png


위 그림에서 볼 수 있듯, 문화비축기지는 구조 특성상 문화마당이라는 하나의 야외 공간에서만 공연이 이루어지는 경우가 거의 없고, 전 공간을 활용하는 이벤트가 열리는 경우가 많다.
본 연구에서는 공연이 아닌 축제는 조사 대상에 포함시키지 않았기에 문화비축기지의 공연 수가 0건으로 나타난 것으로 판단된다.

다음으로는, 10000석 이상 20000석 미만 공연장들의 위치를 살펴보고자 하였다.

【좌석수별 공연장 위치】


10000석 이상 20000석 미만 공연장들은 송파구에 3개, 구로구에 1개, 마포구에 1개 있는 것으로 확인된다.
이 중 공연 목적으로 거의 활용되지 않는 문화비축기지를 제외하면, 모든 공연장이 한강 이남 지역에 있음을 확인할 수 있다.

반면, 한강 이북 지역의 공연장들을 살펴보면 대형 공연장이 드문 대신, 전통적인 공연장이나 소규모 공연장이 많다는 점이 흥미롭다. 이는 한강을 기준으로 공연장 분포와 특성이 크게 다르다는 것을 보여준다.

따라서, 지역별로 달라지는 공연장 규모와 장르, 관객층의 선호도 등 요인을 더 깊이 분석한다면 공연장 운영 전략이나 지역별 공연 문화의 특성을 이해하는 데 중요한 통찰을 얻을 수 있을 것이다. 또한 이는 공연산업의 균형 발전 측면에서도 고려될 수 있다.

공연 쏠림 현상의 또다른 원인으로는 실내/실외 여부가 주목된다. 실내/실외 공연장에 대한 선택은 날씨나 계절의 영향을 많이 받으므로, 이는 다음 파트인 공연 세부사항에서 더 다루어보고자 한다.

개관연도나 본래목적은 공연장 선택과 관계가 없었다. 본래 목적의 경우 체육시설이 공연 목적으로 지어진 시설보다 공연 수가 훨씬 많은 모습을 보였는데, 그 이유는 체육 시설이 대체로 좌석 수가 많기 때문으로 생각된다.
개관연도의 경우, 조사 연도의 범위를 넓혀 리모델링 전후의 공연 횟수를 비교한다면 현재 노후화된 공연장들의 리모델링 여부 선택에 도움이 되는 새로운 인사이트를 발견할 수 있을 것이다.

마지막으로, 지하철역으로부터의 거리나 인근 주차장 수를 통해 접근성을 살펴본 결과, 접근성과 공연 수 사이에는 관계가 없었다.
그러나 이는 매우 단편적인 지표이고, 실질적인 접근성(공연장 자체의 위치적 특성, 주차장에 주차 가능한 대수 등)를 설명할 수 있는 지표가 아니기 때문에 더 구체화해볼 필요가 있다.


2. 공연 세부사항



(1) 공연의 시간/계절적 특성


① 계절별 공연 횟수


MATCH (v:Venue)-[:hosts]->(p:Performance)

WITH toString(p.sdate) AS sdateString
        WITH substring(sdateString, 4, 2) AS 월
       WITH
  CASE
        WHEN 월 IN ['03', '04', '05'] THEN '봄'
       WHEN 월 IN ['06', '07', '08'] THEN '여름'
      WHEN 월 IN ['09', '10', '11'] THEN '가을'
      WHEN 월 IN ['12', '01', '02'] THEN '겨울'
      END AS 계절,
      count(*) AS 공연수
         RETURN 계절, 공연수
       ORDER BY
  CASE 계절
WHEN '봄' THEN 1
WHEN '여름' THEN 2
WHEN '가을' THEN 3
WHEN '겨울' THEN 4
END

계절별공연횟수.png


총 공연 수를 살펴보면, 봄 83회, 여름 90회, 가을 86회, 겨울 94회로 연중 고르게 분포되어 있었다.


①-1 실내/실외 공연장의 경우 어느 계절에 주로 이용되는가


Part 1에서 실내/실외 여부가 공연장 선택의 주요한 요소였던 사실과 연결하여, 이번에는 실내/실외 공연장이 각각 어느 계절에 주로 이용되는지 살펴보고자 했다.

MATCH (v:Venue) -[:hosts]- (p:Performance)

WITH v.inout as 실내외구분,
   toString(p.sdate) AS sdateString
   WITH 실내외구분,
  substring(sdateString, 4, 2) AS 월
   WITH 실내외구분, CASE
WHEN 월 IN ['03', '04', '05'] THEN '봄'
   WHEN 월 IN ['06', '07', '08'] THEN '여름'
  WHEN 월 IN ['09', '10', '11'] THEN '가을'
  WHEN 월 IN ['12', '01', '02'] THEN '겨울'
  END AS 계절,
  count(*) AS 공연수
     RETURN 실내외구분, 계절, 공연수
    ORDER BY 실내외구분,
  CASE 계절
     WHEN '봄' THEN 1
     WHEN '여름' THEN 2
    WHEN '가을' THEN 3
    WHEN '겨울' THEN 4
    END
   

실내실외계절.png


실내 공연은 겨울에 특히 많이 이루어지고, 겨울(94건)-여름(72건)-가을(66건)-봄(61건) 순으로 많았다.
실외 공연은 모든 계절에서 실내 공연보다 적게 이루어졌으며, 특히 겨울은 추운 날씨로 인해서 실외 공연이 아예 없었다. 반면 봄과 가을은 온화한 날씨로 인해 실외 공연이 비교적 많이 이루어졌다.




①-2 특정 계절의 실내외 공연장 선호도가 장르와 연관이 있는가


MATCH (v:Venue) -[:hosts]-> (p:Performance)

MATCH (p)-[:belongsTo]-> (g:Genre)  // Genre 노드와 관계 연결
   WITH v.inout AS 실내외구분, CASE WHEN substring(toString(p.sdate), 4, 2) IN ['03', '04', '05'] THEN '봄'
  WHEN substring(toString(p.sdate), 4, 2) IN ['06', '07', '08'] THEN '여름'
     WHEN substring(toString(p.sdate), 4, 2) IN ['09', '10', '11'] THEN '가을'
     WHEN substring(toString(p.sdate), 4, 2) IN ['12', '01', '02'] THEN '겨울'
     END AS 계절,
  g.name AS 장르
    WITH 계절, 실내외구분, 장르, count(*) AS 공연수
  RETURN 계절, 실내외구분, 장르, 공연수
   

실내실외장르.png
실내실외장르아이돌.png


아이돌 공연은 봄, 여름, 가을, 겨울 모두 실내 공연으로 많이 진행되었다.
공연수는 봄(25), 여름(26), 가을(23), 겨울(17) 순으로 많았고, 실외에서는 봄에 3회, 여름에 1회, 가을에 1회 이루어졌다.

실내실외장르댄스팝.png


댄스/팝 장르 또한 주로 실내 공연으로 진행되었으며, 특히 봄과 겨울에 실내 공연으로 많이 진행되었다.

실내실외장르복합.png


복합 장르의 경우, 실내가 실외보다 많긴 하지만, 실외에서도 봄 6회, 여름과 가을은 10회씩 진행하여 차이가 크지 않았다.
특히 봄에는 실내 5회, 실외 6회로 오히려 실외에서 더 많이 이루어지는 특징적인 모습을 보였다.

실내실외장르발라드.png


발라드 장르는 주로 실내에서 진행되었으며, 겨울에 18회로 압도적인 수의 공연이 이루어졌다.

이외에도, 알앤비/소울 장르와 락/메탈 장르는 겨울에 많이 이루어졌고, 서양음악 장르는 가을에 많이 이루어졌다.


② 단기/장기 공연 수


우선 단기, 장기의 기준을 정하고자 모든 공연을 공연일수별로 구분하였다.

MATCH (v:Venue)-[:hosts]->(p:Performance)

WHERE p.sdate IS NOT NULL AND p.edate IS NOT NULL
WITH v.name AS 공연장명, p.name AS 공연명, date(substring(toString(p.sdate), 0, 4) + '-' + substring(toString(p.sdate), 4, 2) + '-' +  substring(toString(p.sdate), 6, 2)) AS 시작일, date(substring(toString(p.edate), 0, 4) + '-' + substring(toString(p.edate), 4, 2) + '-' + substring(toString(p.edate), 6, 2)) AS 종료일
WITH 공연장명, 공연명, 시작일, 종료일
WHERE 종료일 >= 시작일 WITH 공연장명, 공연명, 시작일, 종료일, duration.inDays(시작일, 종료일).days + 1 AS 공연일수
   RETURN 공연일수, COUNT(*) AS 공연_개수
ORDER BY 공연일수 DESC
 

단기장기.png


1~2일 내로 끝나는 단기 공연이 가장 많았다. 이 결과를 토대로, 단기 공연은 1~2일동안 진행하는 공연, 장기 공연은 3일 이상 진행하는 공연으로 정의하였다.

②-1 단기/장기 공연에 따른 공연장 선호도 파악하기


MATCH (v:Venue)-[:hosts]->(p:Performance)

WHERE p.sdate IS NOT NULL AND p.edate IS NOT NULL
WITH v.name AS 공연장명, p.name AS 공연명,duration.inDays(date(substring(toString(p.sdate), 0, 4) + '-' + substring(toString(p.sdate), 4, 2) + '-' + substring(toString(p.sdate), 6, 2)), date(substring(toString(p.edate), 0, 4) + '-' + substring(toString(p.edate), 4, 2) + '-' + substring(toString(p.edate), 6, 2))).days + 1 AS 공연일수 // 기준에 맞게 단기/장기 공연 유형 분리 WITH 공연장명, 공연명, CASE WHEN 공연일수 <= 2 THEN '단기' WHEN 공연일수 >= 3 THEN '장기' ELSE '기타' END AS 공연유형
WITH 공연장명, 공연유형, COUNT(*) AS 공연_횟수
RETURN 공연장명, 공연유형, 공연_횟수
ORDER BY 공연_횟수 DESC
 

단기장기2.png


장기 공연은 올림픽공원 및 잠실 종합운동장에서 많이 열렸다.
특히 올림픽공원 KSPO DOME은 단기 대비 장기 공연의 비율이 50% 이상으로 나타나면서, 중요한 비중을 차지하고 있었다.

이외에도 장기 공연이 많이 이루어진 공연장들을 살펴보면, 모두 실내 공연장임을 알 수 있었다. 이는 장기 공연의 경우 날씨 변동으로 인한 리스크를 가질 확률이 높기 때문일 것이다.

목동 아이스링크의 경우 4건의 공연 중 4건이 모두 장기 공연이었는데, 이는 장소 특성상 아이스쇼 등 스포츠/퍼포먼스 중심의 장기 이벤트가 일어나기 때문으로 생각된다.


②-2 장기 공연의 주요 장르 알아보기


MATCH (공연장:Venue)-[:hosts]->(공연:Performance)-[:belongsTo]->(장르:Genre)

WHERE 공연.sdate IS NOT NULL AND 공연.edate IS NOT NULL
WITH
  공연, 장르,
date(
substring(toString(공연.sdate), 0, 4) + '-' +
substring(toString(공연.sdate), 4, 2) + '-' +
substring(toString(공연.sdate), 6, 2)
) AS 시작일,
date(
substring(toString(공연.edate), 0, 4) + '-' +
substring(toString(공연.edate), 4, 2) + '-' +
substring(toString(공연.edate), 6, 2)
) AS 종료일
WITH
공연, 장르,
duration.inDays(시작일, 종료일).days + 1 AS 공연일수
WHERE 공연일수 >= 3  // 장기 공연만 필터링
RETURN
  장르.name AS 장르명,
COUNT(공연) AS 공연_횟수
ORDER BY 공연_횟수 DESC;

장기장르.png


아이돌 장르가 공연 횟수 27회로 압도적인 1위를 차지했다.
이는 아이돌 팬덤의 충성도가 높고, 콘서트, 투어 같은 대형 이벤트가 자주 개최되는 특징을 반영하기 때문이다.

그러나 이는 단순히 아이돌 장르의 공연 수가 많아서일 가능성이 존재하기에, 장르별 전체 공연 대비 장기 공연의 비율을 계산하여 비교하기로 하였다.

이를 위해 먼저 단기/장기 통합 장르별 공연횟수를 계산하였다.

MATCH (g:Genre)<-[:belongsTo]-(p:Performance)

RETURN g.name AS 장르, COUNT(p) AS 공연횟수
ORDER BY 공연횟수 DESC;

통합장르.png


이후 엑셀을 활용하여 장르별 전체 공연 대비 장기 공연의 비율을 계산하였다.

통합장기비율.png



복합 장르와 랩/힙합 장르의 장기 공연 비율이 매우 낮게 나타났다.
표 하단의 공연들은 총 공연 수가 적기 때문에 비율에 큰 의미는 없다.


②-3 장기 공연과 공연에 참여하는 아티스트 수의 관계


위에서 복합 장르와 랩/힙합 장르의 장기 공연 비율이 매우 낮게 나타났는데, 두 장르의 공통점이 한 공연에 여러 아티스트가 등장하는 경우가 많다는 것이다. 이에 장기 공연과 공연에 참여하는 아티스트 수의 관계를 살펴봄으로써, 공연에 참여하는 아티스트 수가 적을수록 장기공연이 용이할 것이라는 가설을 검증하고자 하였다.

MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist)

WHERE p.sdate IS NOT NULL AND p.edate IS NOT NULL
WITH v.name AS 공연장명, p AS 공연, a.name AS 아티스트명,
duration.inDays(date(substring(toString(p.sdate), 0, 4) + '-' + substring(toString(p.sdate), 4, 2) + '-' + substring(toString(p.sdate), 6, 2)), date(substring(toString(p.edate), 0, 4) + '-' + substring(toString(p.edate), 4, 2) + '-' + substring(toString(p.edate), 6, 2))).days + 1 AS 공연일수
WITH
  공연장명,
  공연,
  아티스트명,
공연일수,
CASE WHEN 공연일수 <= 2 THEN '단기'WHEN 공연일수 >= 3 THEN '장기' ELSE '기타' END AS 공연유형
WITH 공연장명, 공연유형, COUNT(DISTINCT 공연) AS 공연_횟수, COUNT(DISTINCT 아티스트명) AS 참여_아티스트_수
RETURN
  공연장명,
  공연유형, 참여_아티스트_수, 공연_횟수
ORDER BY 공연_횟수 DESC

장기아티스트.png


실제로 장기 공연의 경우 공연당 참여한 평균 아티스트 수 (참여 아티스트 수 / 공연 횟수)가 단기 공연보다 훨씬 적게 나타남을 확인할 수 있었다.
예를 들어, 고려대학교_화정체육관_주경기장의 경우 아티스트 수는 2명인데, 장기 공연 횟수가 2회였고,
연세대학교_노천극장 장기 공연 참여 아티스트 수는 2명인데, 공연 횟수가 3회였다.

또한, 예외적인 경우로 목동 아이스링크를 발견할 수 있었다.
목동_아이스링크의 경우 아티스트 수는 47명, 장기 공연 횟수는 4회였는데, 이는 장기 공연의 효율성이 아티스트 수보다 공연 기간과 공연 내용에 의존하는 경우라고 볼 수 있다.


(2) 공연 티켓 가격과 관련된 쿼리

① 무료 공연의 경우 주로 언제, 어디에서 열리는가?


MATCH (v:Venue)-[:hosts]->(p:Performance)

WHERE p.minprice = 0
    RETURN v.name AS 공연장명, p.name AS 공연명, p.sdate AS 공연시작일, p.edate AS 공연종료일
   ORDER BY p.sdate

무료공연.png


롯데 패밀리 콘서트, 코리아 메모리얼 페스타를 제외하면 모든 콘서트가 하루만 진행하는 것으로 나타났다.
무료 공연은 수익원이 없기 때문에 상업 공연에 비해 비용에 더 민감하며, 예산 절감을 위해 공연을 하루에 마무리하는 것이 더 효율적일 가능성이 크다.
또한 해당 무료 공연들이 이루어진 공연장들을 보면 대관료가 높은 상업 목적의 공연장 '연세대학교'나 '코엑스'는 포함되어 있지 않음을 알 수 있는데, 우리는 이 또한 무료 공연의 비용 민감성 때문일 수 있다고 보았다.
이를 바탕으로 '무료 공연은 상업 시설보다 공공 또는 민간 시설에서 더 자주 이루어진다'라는 가설을 검증해보고자 했다.


①-1 공공/민간/상업 공연장별 무료 공연 건수


MATCH (v:Venue)-[:hosts]->(p:Performance)

WHERE p.minprice = 0
      RETURN v.orgfeature AS Venue_유형, COUNT(*) AS 공연_건수
ORDER BY COUNT(*) DESC

공공상업민간.png


쿼리 실행 결과, 공공 19건, 민간 2건, 상업 0건으로, '무료 공연은 상업 시설보다 공공 또는 민간 시설에서 더 자주 이루어진다'라는 가설과 일치했다.
앞서 언급했듯, 공연 대관료가 높은 상업 공연장에서 무료 공연은 현실적으로 어려울 수 있고,
상업 공연장들은 기본적으로 수익 기반 모델이기 때문에, 무료 공연보다는 유료 공연 중심으로 운영될 가능성이 높다.


② 무료 공연은 주로 어떤 장르에 속해 있는가?


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:belongsTo]->(g:Genre)

WHERE p.minprice = 0
   RETURN DISTINCT g.name AS 장르, p.name AS 공연명
ORDER BY g.name, p.name

무료공연장르.png


21건 중 무려 17건이 '복합' 장르라는 점이 특징적이었다.

이에 대한 이유로는 다음 두 가지를 고려할 수 있다:
1. 무료 공연은 특정 관심사나 장르에 국한되지 않고, 다양한 연령대와 취향을 아우르는 공연으로 기획될 가능성이 크다.
2. 기획 비용 절감을 위해, 출연료가 높은 아티스트보다는 비교적 저렴한 출연료를 받는 아티스트를 여러 명 섭외하는 전략을 취할 수도 있다.


③ 대관료와 티켓 가격 간에 상관관계가 존재하는가?


공연장별 평균 티켓 가격과 평균 대관료를 비교하는 쿼리를 통해 대관료와 티켓 가격 간 상관관계를 파악하고자 하였다.

MATCH (v:Venue)-[:hosts]->(p:Performance)	
WHERE v.wdfee IS NOT NULL AND v.hdfee IS NOT NULL AND p.minprice IS NOT NULL AND p.maxprice IS NOT NULL AND v.ticketfee IS NOT NULL	
WITH v, 	
(p.minprice + p.maxprice) / 2 AS 티켓가격평균,  // 공연당 평균 티켓가격 계산	
v.ticketfee AS 티켓수수료율, 	
v.wdfee AS 평일대관료, 	
v.hdfee AS 휴일대관료	
WITH v.name AS 공연장명, 	
티켓가격평균,	
CASE 	
WHEN v.ticketfee > 0 THEN 	
(v.wdfee + v.hdfee) / 2 + (티켓가격평균 * v.ticketfee / 100)  // 수수료 계산	
ELSE 	
(v.wdfee + v.hdfee) / 2  // 수수료 없을 때 대관료 계산	
END AS 최종대관료	
WITH 공연장명, 	
COLLECT(티켓가격평균) AS 공연가격목록,  // 공연당 티켓 평균 가격 목록 수집	
COLLECT(최종대관료) AS 대관료목록  // 공연당 대관료 목록 수집	
WITH 공연장명,	
REDUCE(total = 0, x IN 공연가격목록 | total + x) / SIZE(공연가격목록) AS 공연장별평균티켓가격, // 평균 계산	
REDUCE(total = 0, x IN 대관료목록 | total + x) / SIZE(대관료목록) AS 최종대관료평균	
RETURN 공연장명, 	
ROUND(공연장별평균티켓가격, 2) AS 공연장별평균티켓가격,	
ROUND(최종대관료평균, 2) AS 최종대관료평균	
ORDER BY 최종대관료평균 DESC	


쿼리에서 티켓 평균 가격과 최종대관료 계산 방법은 다음과 같다:

  1. 티켓평균가격 계산:
    • 공연당 (minprice + maxprice) / 2로 평균 티켓 가격 계산
  2. 최종대관료 계산:
    • 수수료 적용 공식 (평일대관료 + 휴일대관료) / 2 + (평균 티켓 가격 * 티켓 수수료율 / 100)
    • 수수료가 없으면 (평일대관료 + 휴일대관료) / 2
  3. 이후 공연장별로 티켓가격과 최종대관료의 평균을 구한다.
평균티켓대관료.png



티켓 가격과 대관료 간에는 상관관계가 별다른 상관관계가 없는 것으로 확인되었다.
예상되는 이유는 다음과 같다.

  • 대관료는 공연장마다 정해져 있는 요소로, 주로 시설, 접근성, 평일/주말 여부, 공연장 자체의 정책에 따라 결정된다.
  • 반면 티켓 가격은 공연의 유명도, 아티스트 인지도, 공연 종류, 콘텐츠 퀄리티 등에 따라 결정된다.
  • 결국, 티켓 가격과 대관료는 그 값의 설정에 영향을 미치는 요인이 서로 다르기에 상관관계가 있다고 보기 어렵다.

(3) 공연장별 특화 장르


① 공연장별 가장 많은 공연을 한 장르와 그 횟수 찾기


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:belongsTo]->(g:Genre)

WITH v, g, COUNT(p) AS genreCount
ORDER BY genreCount DESC
WITH v, COLLECT({genre: g.name, count: genreCount}) AS genreList
RETURN v.name AS VenueName,
genreList[0].genre AS TopGenre,
genreList[0].count AS PerformanceCount

공연장별특화장르.png


'아이돌'과 '복합' 장르가 가장 빈번하게 특화 장르로 나타났다.
다만 단순히 해당 장르들의 총 공연 수가 많기에 나타날 수 있는 현상이기에 추가적인 분석이 필요해 보인다.


①-1 TopGenre가 아이돌인 공연장의 좌석 수


이전 쿼리에서 아이돌이 특화 장르로 나타난 공연장이 많았기에, 해당 공연장의 좌석수와 관련지어 고려해 보았다.

MATCH (v:Venue)-[:hosts]->(p:Performance)-[:belongsTo]->(g:Genre)

WITH v, g, COUNT(p) AS genreCount
  ORDER BY genreCount DESC
  WITH v, COLLECT({genre: g.name, count: genreCount}) AS genreList
  WHERE genreList[0].genre = '아이돌'  // TopGenre가 '아이돌'인 경우만 필터링
RETURN v.name AS VenueName, v.seats AS SeatCount,  // 공연장의 좌석 수 추가
genreList[0].genre AS TopGenre,
  genreList[0].count AS PerformanceCount

아이돌좌석수.png


TopGenre가 아이돌인 공연장 6개 중 5개가 좌석 수 10000석 이상이었다.
이는 아이돌 공연의 대규모 관객 동원력을 수용하기 위해 상대적으로 큰 규모의 공연장이 활용된다는 것을 보여준다.


①-2 장르별 총 공연 횟수


장르(Genre)별 총 공연(performance) 횟수를 파악해, 위 ①의 결과가 총 공연 횟수에 영향을 받았는지 파악하고자 했다.

MATCH (v:Venue)-[:hosts]->(p:Performance)-[:belongsTo]->(g:Genre)

WITH g, COUNT(p) AS totalGenrePerformances

MATCH (v:Venue)-[:hosts]->(p:Performance)-[:belongsTo]->(g)
WITH v, g, COUNT(p) AS venueGenrePerformances, totalGenrePerformances

WITH v, g, venueGenrePerformances, totalGenrePerformances,
toFloat(venueGenrePerformances) / totalGenrePerformances AS Percentage

WITH v, g, venueGenrePerformances, totalGenrePerformances, Percentage
ORDER BY v.name, Percentage DESC

WITH v, COLLECT({
genre: g.name,
percentage: Percentage,
performances: venueGenrePerformances,
total: totalGenrePerformances
})[0] AS topGenre

RETURN v.name AS VenueName,
topGenre.genre AS TopGenre,
topGenre.performances AS VenueGenrePerformances,
topGenre.total AS TotalGenrePerformances,
ROUND(topGenre.percentage * 100, 2) AS TopPercentage
ORDER BY TopPercentage DESC

장르별총공연.png


실제로 '아이돌'과 '복합' 장르의 공연이 가장 많은 것으로 확인되었다.

② 장르별 특화 공연장


각 장르의 총 공연 수 대비 해당 공연장의 해당 장르 총 공연 수의 비율로 TopGenre를 설정하여, 총 공연 횟수의 차이에 영향받지 않은 특화 공연장을 알아보고자 했다.

장르별특화.png



①과 ②의 TopGenre를 함께 보면 다음과 같다.

둘다.png



공연장에서 가장 많이 공연한 장르와 (공연장에서 해당 장르의 공연 수)/(해당 장르의 총 공연 수)의 비율로 계산한 장르가 불일치하는 경우가 다수 있었다.

(4) 결론


Part 2에서는 공연의 특성과 관련된 관계들을 살펴보았다.

  1. 공연의 시간 및 계절적 특성
    • 계절별 공연 횟수는 봄 83회, 여름 90회, 가을 86회, 겨울 94회로 연중 고르게 분포되어 있었다.
    • 실내/실외 공연장 이용에서는 실내 공연이 겨울에 많았고, 실외 공연은 봄과 가을에 집중되며 겨울에는 아예 없었다.
    • 이를 통해 겨울과 여름에는 실내 공연장 과다 활용 문제실외 공연장 저활성화 문제가 동시에 나타남을 확인하였다.과다 활용 문제에 관하여, 수요가 몰리는 시즌에 실내 공연장 예약 경쟁이 심해질 수 있으므로 공연자는 이 점을 미리 고려하고 공연장을 대관해야 한다. 또한, 실외 공연장의 저활성화 문제 해결방안은 아래의 분석과 함께 도출하였다.
    • 계절별 공연의 장르를 살펴보았을 때, 복합 장르는 계절적 특성이 덜 뚜렷한 특징을 지니고 있었다. 복합 장르의 공연은 실내뿐 아니라 실외에서도 비슷한 빈도로 공연되었다. 따라서 여름과 겨울처럼 실내 공연장이 과다 활성화되는 시기에는, 페스티벌 등 복합 장르 공연을 적극적으로 기획하여 실외 공연의 활성화를 도모할 필요가 있다.
    • 다음으로 공연의 기간 측면에서 분석하자면, 대부분의 공연은 단기 공연(1~2일 내)으로 진행되었다. 장기 공연은 주로 올림픽공원, 잠실 종합운동장 등 대형 실내 공연장에서 열렸으며, 아이돌 장르가 장기 공연에서 가장 두드러졌다. 복합 및 랩/힙합 장르는 장기 공연 비율이 매우 낮았는데, 그 이유는 장르 특성상 하나의 공연에 여러 아티스트가 참여하여 관리하기가 어렵기 때문으로 보인다. 따라서 장기 공연은 관객 동원력이 높은 소수의 아티스트 위주로 이루어지게 되고, 팬층이 두터운 아이돌들이 장기 공연을 열기 쉽다.
  2. 티켓 가격 및 무료 공연
    • 무료 공연은 대부분 공공 공연장에서 하루만 진행되었으며, 주로 복합 장르(총 17건)가 포함되었다. 2023-2024년 무료 공연 수는 과거에 비해 급감했으며, 이는 코로나19로 인한 온라인 공연 대체 가능성과 연관이 있을 수 있다. 또한 무료 공연의 목적은 보통 홍보 또는 캠페인이었다. 대관료와 티켓 가격 간 상관관계는 발견되지 않았다.
  3. 공연장별 특화 장르
    • 아이돌과 복합 장르가 가장 빈번하게 공연되었으며, 아이돌 장르는 대부분 10,000석 이상의 대규모 공연장에서 진행되었다. 공연장에서 가장 많이 열린 장르와 전체 공연 수 비율로 계산한 주요 장르가 일치하지 않는 경우가 많았다. 특히 공연 수로는 '아이돌'이 가장 많이 열리는 장르로 나타나지만, 비율로 분석했을 때는 다른 장르가 우세한 경우도 있었다. 이러한 현상은 아이돌 공연의 수요가 높아 공연장에서 빈번히 열리는 상황 때문이다. 일부 공연장이 아이돌 외의 장르를 위한 공간으로 설계되었음에도 불구하고, 아이돌 공연의 수요가 지속적으로 집중되면서 장르 다양성이 제한될 수도 있음을 시사한다.



3. 아티스트와 공연, 공연장의 관계



(1) 가장 많은 해외 아티스트가 공연한 공연장


① 가장 많은 해외 아티스트가 공연한 공연장


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist) WHERE a.origin = "해외" WITH v, COUNT(p) AS foreignPerformanceCount RETURN v.name AS VenueName, foreignPerformanceCount AS ForeignPerformanceCount ORDER BY ForeignPerformanceCount DESC
아티스트쿼리1.png


-가장 많은 수의 해외 아티스트들이 공연한 이력이 있는 공연장들을 도출해내, 해외 아티스트가 선호하는 공연장을 파악하고자 한다.
-올림픽공원_야외(88_잔디마당)와 고척_스카이_돔구장, 목동 아이스링크 등이 가장 많은 해외 아티스트가 방문한 공연장으로 파악되었다.


② 해외 아티스트의 공연이 가장 여러 차례 일어난 공연장


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist) WHERE a.origin = "해외" WITH v, COUNT(DISTINCT p) AS foreignPerformanceCount RETURN v.name AS VenueName, foreignPerformanceCount AS ForeignPerformanceCount ORDER BY ForeignPerformanceCount DESC
아티스트쿼리2.png


인사이트 및 분석
-올림픽 공원_kspo_dome: 해외 아티스트의 단독 공연이 가장 많이 개최된 공연장이다. 흔히 내한 공연으로 생각하는 해외 아티스트들이 단독 공연 후보지로 적합하다.
-올림픽공원_야외(88_잔디마당): 다수의 해외 아티스트가 같은 공연에 참여한 횟수가 많다. 여러 명의 DJ가 함께 참여하는 페스티벌 형식의 공연의 공연장으로 적합하다는 가설을 세울 수 있다.
-목동_아이스링크: 해외 아티스트들의 합동 공연 비율이 가장 높은 공연장이다.
-고척스카이_돔구장: 해외 아티스트의 단독 공연과 합동 공연 모두 활발하게 일어난다.


(2) 같은 공연장에서 여러 번 공연한 아티스트들


① 한 공연장에서 중복 공연한 아티스트들


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist) WITH v, a, COUNT(p) AS PerformanceCount WHERE PerformanceCount > 1 RETURN v.name AS VenueName, a.name AS ArtistName, PerformanceCount ORDER BY VenueName ASC, PerformanceCount DESC
아티스트쿼리3.png


-총 249명의 아티스트가 한 공연장에서 2회 이상 공연한 이력이 있다.
-대표적으로 올림픽공원 야외(88잔디마당)은 소란과 데이브레이크에게, 고려대학교 화정체육관은 애쉬 아일랜드에게 좋은 공연을 만들 환경을 제공한다고 유추해볼 수 있다.
-하지만, 개별적인 아티스트의 반복 공연 횟수를 도출해 획득할 수 있는 인사이트가 부족하다고 느꼈다.



② 아티스트의 장르 별 중복 공연 횟수


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist)-[:performs]->(g:Genre)

WITH v, a, g, COUNT(p) AS PerformanceCount
WHERE PerformanceCount > 1
WITH g.name AS GenreName, SUM(PerformanceCount) AS TotalPerformances
RETURN GenreName, TotalPerformances
ORDER BY TotalPerformances DESC

아티스트쿼리4.png


-해당 아티스트들을 장르별로 분석해, 반복 공연 아티스트들에게 장르 편향성이 존재하는지 파악하고자 한다.
-인디, 랩/힙합, 아이돌: 가장 많은 수의 아티스트들이 같은 공연장에서 수 차례 반복해 공연했다.
-해당 장르의 아티스트들이 선호하는 특정 공연장의 존재, 혹은 장기 공연의 가능성을 시사한다.
-하지만 동시에, 해당 장르의 아티스트 모수가 많아 왜곡된 결과일 가능성이 존재한다.


②-1 장르별 아티스트 수 합계


MATCH (a:Artist)-[:performs]->(g:Genre) WITH g.name AS GenreName, COUNT(DISTINCT a) AS TotalArtists RETURN GenreName, TotalArtists ORDER BY TotalArtists DESC
아티스트쿼리8.png


-②의 결과의 신뢰성 확보를 위한 보조 쿼리
-(아티스트의 장르 별 중복 공연 횟수)/(장르별 아티스트 수 합계)의 비율을 계산해보았을 때, 인디 장르는 1.775, 랩/힙합 장르는 0.76887, 아이돌 장르는 0.853으로 나타난다. 전체 평균이 0.766으로 도출되었기에, 인디 장르의 아티스트들은 같은 공연장에서 반복 공연하는 비율이 높지만, 아이돌이나 랩/힙합 장르는 평균적인 범주에 머물랐다고 볼 수 있다.


③ 공연장 별 아티스트의 중복 공연 횟수


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist) WITH v, a, COUNT(p) AS PerformanceCount WHERE PerformanceCount > 1 WITH v, COUNT(DISTINCT a) AS ArtistWithMultiplePerformances RETURN v.name AS VenueName, ArtistWithMultiplePerformances AS RepeatedArtistsCount ORDER BY RepeatedArtistsCount DESC
아티스트쿼리5.png


-올림픽공원, 화정체육관, KSPO DOME은 아티스트들이 반복 방문한 횟수가 가장 많은 공연장이다.
-다수의 아티스트들과 밀접한 관계를 맺고 있다고 해석 가능하지만, 역시 해당 공연장에서 공연에 참여한 아티스트의 수가 더 많아 왜곡되었을 가능성이 있기에 추가적인 분석이 필요하다고 생각되었다.


③-1 공연장 별 공연 아티스트 수 합계


MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist) WITH v.name AS VenueName, COUNT(a) AS TotalArtistAppearances RETURN VenueName, TotalArtistAppearances ORDER BY TotalArtistAppearances DESC
아티스트쿼리6.png


-올림픽공원 야외(88잔디마당), 화정체육관 그리고 KSPO DOME이 수와 비율의 측면에서 아티스트들이 가장 많이 중복 공연한 공연장으로 보인다.
-고척스카이돔, 서울어린이대공원 숲속무대, 연세대 노천극장은 아티스들의 반복 공연 비율이 가장 적은 공연장들이다.


④ 공연장 별 반복 공연 아티스트가 가장 많은 장르


-특정 공연장을 가장 선호하는 아티스트들의 장르를 파악하고자 한다.
-이는 해당 공연장과 장르 간의 밀접성, 즉 긍정적인 시너지 효과의 존재를 시사하기에 유의미하다.

MATCH (v:Venue)-[:hosts]->(p:Performance)-[:features]->(a:Artist)-[:performs]->(g:Genre) WITH v, g, COUNT(DISTINCT a) AS UniqueArtists ORDER BY v.name, UniqueArtists DESC WITH v.name AS VenueName, COLLECT({genre: g.name, artists: UniqueArtists})[0] AS TopGenre RETURN VenueName, TopGenre.genre AS TopGenreName, TopGenre.artists AS UniqueArtists ORDER BY UniqueArtists DESC
아티스트쿼리7.png


-아이돌 장르의 아티스트들이 여러 공연장에서 반복 공연을 했음을 확인할 수 있다. 이는 일반적으로 아이돌 장르 아티스트들의 공연이 수일에 걸쳐 진행된다는 특성을 반영한다.
-올림픽공원_야외(88잔디마당) 인디 아티스트들이 반복적으로 찾는 공연장으로 나타났고, 화정체육관은 랩/힙합 아티스트들이 반복적으로 찾는 공연장으로 나타났다.


④-1 공연장 별 반복 공연 아티스트가 가장 많은 장르


-쿼리 4의 결과가 장르별 총 아티스트 수에 영향을 받았는지 살펴보기 위한 보조 쿼리

MATCH (a:Artist)-[:performs]->(g:Genre) WITH g.name AS GenreName, COUNT(DISTINCT a) AS TotalArtists RETURN GenreName, TotalArtists ORDER BY TotalArtists DESC
아티스트쿼리8.png


-올림픽공원_야외(88잔디마당)은 80명의 인디 아티스트 중 37명이 2회 이상 공연한 이력이 있다. 인디 장르의 아티스트들과 상당히 밀접한 관계를 갖고 있음을 알 수 있다. 해당 공연장이 갖고 있는 특성들(실외 등)이 인디 장르와 좋은 시너지 효과를 낸다고 볼 수 있다.
-화정체육관이 쿼리 4 에서 랩/힙합과 밀접한 관계를 가진 것처럼 나타난 이유는 단순히 해당 장르의 아티스트가 가장 많기 때문이며, 타 공연장-장르 관계에 비해 유의미하게 높은 밀접성을 보이지 못했다.


연구 후기



JJE24KU 😛 평소에는 소비자 입장에서 공연을 즐기기만 했는데, 이번 연구를 통해 공연 기획자를 위해 공연 데이터를 정리하고 분석하는 경험을 하게 되어 색다른 경험이었습니다. 연구를 하며 공연장과 공연의 공급과 수요 사이에서 중요한 역할을 하는 플랫폼으로서의 공연장의 중요성을 실감했습니다. 공연장을 단순히 "공연을 하는 장소"로만 생각했었는데, 그 안에서 양측의 니즈를 충족시키는 것이 얼마나 어려운지 깨닫게 되었습니다. 그리고 우리나라에서 이렇게나 많은 공연이 이루어지고 있구나 하는 것을 ㅎㅎ… 실감하였습니다. 몇천 건의 공연 데이터를 정리하는 과정이 쉽지는 않았던 것 같습니다.

공연장 범위를 좀 더 확대하고, 지역별 비교나 공연 규모별 비교를 통해 더 많은 데이터를 포함시킬 수 있었다면 더 풍부한 분석이 가능했을 것 같고, 시간상 기획사 파트를 포함시킬 수 없었던 점도 아쉬움이 남습니다. 그래도 주어진 제약 내에서는 최대한의 성과를 내려고 했었고, 연구 대상이었던 공연장들에 대해서는 어느 정도 전문가(?)처럼 접근할 수 있게 되었다고 생각합니다. 아쉬움은 남지만 정말 값진 경험이었습니다!



SWJ24KU 😺 '공연장'에 대해 이렇게 심도있게 고민해본 사람들이 얼마나 될까? 라는 생각이 들며 스스로 뿌듯해지곤 했던 프로젝트입니다. 다른 팀원분들께서도 말씀하신 것처럼, 어떤 부분들에선 아쉬움이 남기도 하지만 이는 받아들이는 것이 좀 더 아름다운 결말인 것 같습니다. 주제 자체에서 오는 흥미도 있었지만, '데이터인문학'이라는 범주 자체도 많은 인사이트를 남겨주었습니다. 인문학과 관련된 주제에서 새로운 데이터를 만든다는 점에서 기존의 팀프로젝트에 비해 스스로 고민하고 규정해야하는 것들이 많았는데, 이를 위해 서로 소통하고 협력하며 결과물을 만들어내던 과정이 저에겐 성장할 수 있는 양분으로 남은 것 같습니다. 열정 쏟으며, 스스로 많은 고민해볼 수 있었던 귀중한 경험이었습니다. 팀원분들 너무너무 감사합니다.



KJY24KU 😄 정말 이런 프로젝트야말로 대학생이 대학교에서 한번 정도는... 아니 많이 해볼수록 좋은 프로젝트라는 생각이 들었습니다. 팀원들 모두 다른 과제나 팀플 때문에 시간이 많이 없는 상황임에도 불구하고 여러 번 만나서 방대한 양의 데이터를 수집하고 편찬하여 결과물을 만들어냈다는 게 너무 감동적이지 않나요..? 물론 아쉬운 점도 많이 남았지만, 고민하고 조사할 시간이 좀 더 넉넉했다면 충분히 더 보완할 수 있었을 것이라고 믿기 때문에 후회는 없는 것 같습니다. 그리고 프로젝트를 진행하면서 팀원분들께도 많은 것을 배울 수 있었던 것 같아서 너무 감사합니다. 정말 너무 수고 많으셨습니다!



HJD24KU 🍻 주제 선정부터 마무리까지 정말 재미있게 참여했던 프로젝트였습니다. 거의 매주 회의를 할 때마다 다 와주시고,,, 팀원분들 열심히 참여해주셔서 감사합니다. 정리해야 할 데이터가 몇천개가 될만큼 양이 많았는데, 정말 모두들 수고하셨고, 다음에 또 뵐 기회가 있었으면 좋겠습니다 :) 고생하셨습니다.



JHW24KU 🙄 가장 먼저 2달간 수천건의 데이터를 함께 정리하고 분석한 조원들에게 너무 감사하다는 말을 전하고 싶습니다. 조장으로서 제가 제 자신에게 기대했던 만큼 많은 인사이트와 유의미한 의견을 내지 못한 것 같아 아쉽고 죄송하지만, 모든 팀원분들이 너무 열정적이고 주체적으로 임해주셔서 잘 마무리할 수 있었던 것 같습니다.

올해 들어 공연 예술에 대해 큰 관심을 제가 갖게 되어서 생각해본 주제인데, 그냥 가서 즐기기만 했던 예전과는 다르게 공연과 공연장에 대한 애정과 분석적이고 포괄적인 관점을 가지게 된 것 같습니다. 종강 직후 대만 여행을 갔다 왔는데 거기서 한 공연장을 지나면서 '여기는 대만의 잠실종합운동장이구나...' 라는 생각을 하게 되더라고요 ㅎㅎ. 다루어야 했던 데이터의 양 자체가 많아서 보다 구체적인 분석을 하지 못한 것이 아쉬움이 남습니다. 여러분이 피드백을 주셨던 기획사에 관한 부분이라던가, 현실적인 한계에 부딪혀 포기하게 된 요일별 분석과 같은 지점들을 추가적으로 다뤘다면, 공연 예술에 대해 더 포괄적인 정보를 제공해줄 수 있지 않았을까라는 생각이 들곤 합니다. 그럼에도 불구하고 대학 입학 후 가장 열정적으로 진행한 팀플인 만큼 얻어가고 배워가는 것도 너무 많은 것 같습니다. 무언가에 대해 지속적으로 고민해보고, 답이 정해지지 않은 질문에 대해 생각해보며 내적으로 성장을 많이 했고, 함께한 조원들을 보면서 감탄도 많이 하고 배우기도 많이 했습니다. 그래도 가장 기억에 남는 순간은 마지막까지 고민해가면서 완성한 부분을 발표하고 난 뒤, 긍정적인 피드백을 들었을 때 인 것 같네요. 정말 다들 너무 고생하셨습니다😄




코멘트


가마니있으시조

SYW24KU 🐰 저희 팀과 다르게 숫자와 관련된 데이터에 대한 분석 위주로 연구가 진행된 점이 흥미로웠습니다. 개인적으로 관심이 있는 주제이기 때문에 발표를 매우 흥미롭게 들었고, 공연장의 여러 요소들이 공연과 관련된다는 것을 깨달았습니다. 특히 아티스트 별로 선호하는 공연장이 있다는 사실이 굉장히 재미있었습니다. 앞으로 공연을 보러 갈 때 발표해주신 내용들이 기억 한구석에서 떠오를 것 같다는 생각이 들었습니다!ㅋㅋ 데이터 조사와 구축에 아주 많은 시간을 들이신 것 같았습니다. 너무 고생하셨습니다, 수고하셨어요!!



HCW24KU 🐯 자료에 대한 해석 위주였던 저희 조와는 다르게 데이터 분석 결과가 표로 정말 (숫자 공포증인 저에게 공포감을 일으킬 정도로) 잘 정리되어 있어서 발표를 들으며 꽤 놀랐습니다. 약간 과장해서 경이롭다는 말은 이럴 때 쓰는구나 실감했습니다.. 이렇게 체계적인 결과를 도출해내려 데이터를 수집 및 정리하는 데에 얼마나 많은 시간을 쓰셨을지 감도 안 옵니다. 공연장이라는 것을 단순히 공연이 이루어지는 장소 정도로 여기고 있었는데, 스위프트 조의 연구를 통해 생각보다 많은 대상들과 관계를 맺고 있는 것을 확인하고 나니 공연장을 단순 장소를 넘어 다양한 주체들 간의 상호작용이 일어나고, 그 스스로도 하나의 주체로서 다른 요소들과 상호작용하는 '공간'의 개념으로 인식할 수 있게 된 것 같습니다. 수고하셨습니다!



JIH24KU 🐣 대부분 확실한 기준과 우선순위를 가지고 데이터를 편찬하신것같아 연구의 신뢰성이 높다는 생각이 들었습니다. 그리고, 연구 결과에 표가 많이 등장했는데, 단순 수 비교뿐만이 아니라 몇몇 지표는 비율로 접근한 점이 인상깊었습니다! 단순 수만 비교한다면 통제할 수 없는 변수의 영향을 많이 받을 수 있을 것 같았는데, 보다 정확한 인사이트 도출을위해 노력하신 것 같았습니다. 모두 한 학기 너무 수고 많으셨습니다!!



KSH24KU 👍🏻 해당 분야의 데이터가 적었던 동상 조사와는 달리, (일부분이지만) 기존에 명확한 구심점이 존재했던 주제였기에 연구에 있어 부담이 있었을 것이라 생각하였습니다. 그럼에도 불구하고 엄청난 양의 도표와 더욱 폭넓은 조사로 강점을 살려, 이에 대한 염려를 확실히 해소했다고 생각합니다. 특히 결과를 바탕으로 실제 아티스트와 공연장 간의 실제적 추천 지수를 제안한 지점이 가장 인상 깊었습니다. 이는 어떤 이의 조언처럼, 공연 기획자에 있어서 굉장히 매력적인 요소라고 생각하였습니다. 고려대학교가 생각보다 많은 행사의 주최를 했다는 것도 놀라웠었고요. 또 온통 빨간 옷을 입었던 올해 고연전 날, 학교에서 저 멀리 떨어진 경기도 지하철에 앉아 있던 옆자리 분이 저에게 화정체육관 가는 길을 여쭤보셨던(ㅋㅋㅋㅋ) 기억이 새록새록 나기도 했었네요.

열정 넘치는 학우분들 덕분에 동상과 공연장이라는 단어가 저에게 크게 다가온 한 학기였던 것 같습니다! 다들 정말 고생하셨어요. 즐거운 방학 즐기시길 바랍니다



YHW24KU 🐹 처음 선정할 때 비록 저는 동상이라는 주제를 연구하기로 했지만 공연장과 공연이라는 스위프트조의 주제가 굉장히 흥미롭고 재밌어보였습니다. 그리고 한 학기를 지내오며 옆에서 굉장히 많은 수의 데이터를 다루고 분류하는 모습을 보며 대단하다는 생각이 들고 한편으론 동기부여도 되었습니다. 그리고 그 결과가 정말 멋지게 나온 것 같아 놀라웠습니다. 어떤 명확한 문제의식을 가지고 얼핏 보면 단순해 보일 수 있는 데이터들을 함께 융합하고 조합하여 의미있는 인사이트들을 도출해낸 모습이 데이터 인문학에 상당히 걸맞다고 생각했습니다. 저희 조와 색다른 관점에서 데이터에 접근한 방식도 새롭고 신선했습니다. 덕분에 데이터 인문학이라는 과목에서 더욱 다채롭고 많은 경험을 접할 수 있었던 것 같아 너무 뿌듯합니다. 스위프트조 분들 다들 한 학기동안 너무 수고 많으셨고 방학 잘 보내시길 바랍니다!




참고 자료


(참고 자료 및 주석은 출처 표기 규칙 페이지를 참고할 것!)

주석




방문자 코멘트


  • 자유롭게 코멘트를 남겨 주세요!