상민과 나의 밥집 평가에 대한 CORRELATION 이 -0.8527이 나온다. -1에 가까우므로 반대 방향의 데이터가 예상된다, 즉 취향이 반대라는 얘기인데, 점수 메긴 숫자로 보면 취향이 반대 같아 보이진 않는다. 내가 평가안한 것(빈칸)에 대해서는 CORREL 함수가 제외하고 계산하는 것은 분명하다. 그리고 내가 평가한 것이 6개 이므로 자유도 5로 계산했을 때 수작업으로 계산해도 같은 값이 나온다.(당연하지 컴퓨터인데)

뭔가, 상관계수로 취향을 분석하는 것은 저렇게만하면 안될것 같다. 당연하지..모두 식당평가를 같은 4점, 3.9점을 주었고 나머지 둘이 달랐으니, 이 들을 관통하는그래프가 예상 밖이 되는데.. 아.. 이런 멍청한.

HHI 지수를 조금 체감하기 위해 숫자놀이를 해보자면,

일단, HHI 란 퍼센트로 표현한 점유율의 제곱 합 이다.

  • 1개의 회사가 전 시장을 다 장악하는 경우 100% 이므로, 제곱합은 그저 100의 제곱인 100000 이다. 이값이 HHI의 최대값을 나타낸다.
  • 2개의 회사가 시장을 반씩 양분하고 있는경우 50%의 제곱합이므로 2500 * 2 = 5000
  • 5개의 회사가 시장을 5등분하고 있는 경우 20%의 제곱합이므로 400 * 5 = 2000
  • 10개의 회사가 시장을 10등분하고 있는 경우 10%의 제곱합이므로 100 * 10 = 1000

어떤 산업이 1000~2000 정도의 HHI 지수를 가지고 있다는 것의 예는 이렇다.

어떤 회사의 최대 점유율이 20% 인 산업군을 하나 만든다면,

  • 20%, 20%, 20%, 10%, 10%, 10%, 10% = 400 + 400 + 400 + 100 + 100 + 100 + 100 = 1600

제 1 점유율이 30%인 산업군의 예는,

  • 30 10 10 10 10 10 10 10 = 900 + 100 * 7 = 1600

제 1 점유율이 40%인 산업군의 예는,

  • 40 5 5 5 5 5 5 5 5 5 5 5 5 = 1600 * 25 * 12 = 1600 + 300 = 1900

훔... 마지막의 경우 두 회사가 합병해서 10인 회사가 생긴다면

  • 40 10 5 5 5 5 5 5 5 5 5 5 = 1600 + 100 + 25 * 10 = 1700 + 250 = 1950

HHI 지수를 보건데, 시장을 독점한다면 그 값의 최대값은 10000 이다. 두 회사가 시장을 양분하고 있으면, 대략 5000 언저리, 2~5개의 회사가 치고 박고 싸우고 있으면 2000 ~ 5000, 5개 이상의 회사가 매우 시끄러우면 2000 이하.

잘 놀았습니다..

모든 게 멈추었다.

급한 불 앞에선 불끄는 것외엔 집중할 여유가 없다. 불끄다 잠시 눈돌려서 할 수 있는 것이라고는 눈에 들어오는 것에 시선을 잠시 고정시켜 따라가는 것일 뿐.

문득문득 나이듦이 머리를 들고, 잃어버린듯한 기회에 대한 아쉬움도 머리를 들고, 할 수 있을 것 같은 자신감은 외면을 한다.

 

지킬 박사와 하이드씨

지킬이 정상이고 하이드가 살인자, 우리 말 어감상 지킬이 강해 보이므로 이름을 한국식으로 바꾼다.

박재권과 하익두씨라고 하면 좀 더 강한 것 같기도 하고...

센서로부터 측정되는 데이터는 전압,전류,저항 값들이다. 그 값을 온도, 기압, 광량, 풍속 등에 매핑하여 각종 의미를 부여한다.

어느 한 순간에 모든 센서의 데이터를 측정한다고 해보자. 이것을 하나의 프레임이라 정한다면 하나의 프레임은 동일 시간대의 모든 센서의 값의 모음이다.

만약 프레임을 벡터로 나타낸다면, (현재 시각, 온도, 습도, GPS 위도, GPS 경도, 빛의 세기, 지구 자기) 이런 식으로 하나의 벡터는 하나의 시간에 표현할 수 있는 모든 데이터의 집합으로 나타낼 수 있다.

또한 만약 1초에 100번의 측정이 일어난다면 저 벡터가 1초에 100개가 생성된다고 할 수 있겠다. 조금 더 나아가서 각 센서 마다 측정되는 주기가 다르다면 어떤 데이터는 비어 있을 수 있는데 이것은 연속량이라고 가정했을 때 대략 측정되는 중간 값을 추정하면 해당 시각의 값을 추정하여 얻을 수 있다. (인터폴레이션, 혹은 보간 이라는 방법으로 알려져있다)

이런 데이터를 저장할 수 있는 가장 좋은 형식은 어쩌면 멀티미디어 파일 아닐까? mkv, mp4 등의 컨테이너들은 내부에 여러 채널을 두고 있다. 또한 각 데이터들은 시간의 흐름에 따른 데이터를 저장하기에도 충분하다.

시간 흐름에 따른 데이터를 적절한 codec을 두어 저장한다면, 굳이 보간법을 이용하여 추정하여 기록하지 않아도 측정 데이터만 넣어두고 codec을 이용하여 특정시간에서의 값을 추출할 수 있게 된다.

이도 저도 아니면, 평면 이미지의 흐름을 저장하는 데이터만으로도 가능하다. 이미지의 각 점을 특정 센서의 측정값으로 저장하면 640x480 짜리 동영상은 30만개나 되는 센서의 흐름을 표현할 수 있기 때문이다.

서사라는 것은 시간의 흐름에 따라 떠오르는 생각을 표현하는 것이다. 그것이 말이 되기도하고 말이 되지 않기도 한다. 생각이 몇 단어 혹은 몇 장면으로 매핑이 되는 순간 정보 손실은 일어 날 수 밖에 없다. 그럼에도 불구하고 두 개의 지점에서 (뇌 혹은 데이터 저장소) 같은 '것'을 공유하기 위해서는 어떤 식으로든 서사적으로 표현된다. 손실을 최소화하는 방향으로 서로가 합의하게 되면서 시간을 단축할 수 있고, 시간 효율성을 높일 수 있다.

무작위 시도와 효율적인 것의 취사 선택의 누적은 자연의 진화에서 일어 났듯이, 매 일상에서 반복되는 것이며, 모든 독립 개체간에 발생하는 것이다.

인간이 꿈을 꾼다는 것은 일종의 무작위적인 시도의 결과이다. 그나마 근사하게 전달의 효율이 높은 방향에서의 전개를 선택했기 때문에 뭔가 말이 되는듯 되지 않는 것이다. 이런 무작위의 말도 되기도하고 되지않기도하는 꿈이 뇌리에서 사라진다는 것은 때론 원치않는 상황이기도하다. 하지만 취사선택에 빠른 두뇌 신경망은 중요도에 대한 판단을 심각하게하지 않으며, 곧 망각하게 된다. 꿈을 오래 간직하고 싶다면 기록을 하는 정도의 영구 보존 영역으로 옮겨야한다.

말이 되는 장면만 최대한 선택해서 말이 되는 표현으로 최대한 기록해야한다.

퇴근, 변명, 얼굴

노래하는 고속도로를 지날 때 언젠가는 한 번 정리해봐야겠다고 도로의 홈 간격에 대한 생각.

일단 속도마다 다른 음이 날테니까 기준되는 속도를 100km/h로 정해보자.

100km/h는 초속으로 100*1000m/3600sec 이므로 1000/36 m/s = 27.7777 m/s


100km/h = 27.7777 m/s

시속 100km를 달리면 1초에 28m를 간다.


기준음 '라'는 진동수가 440Hz라는 것은 그냥 알고 있다. 즉, 1초에 440번 두드리면 '라' 소리가 난다.

옥타브가 하나 올라가면 진동수가 배가 된다. 즉 한 옥타브 높은 '라'는 880Hz다.

한 옥타브는 12개의 반음이 있다. 

평균율 음계에서의 음의 증가는 주파수를 log를 취했을 때 일정한 간격으로 증가하는 것을 알고 있다.

즉,


880Hz = 2 * 440Hz

log 880 = log (2 * 440) = log 2 + log 440

한 옥타브가 올라가면 주파수의 로그값은 log 2 만큼의 증가가 일어난다. 그러면 12개 들어 있으므로 하나의 반음은  log2의 1/12만큼 증가한다.


피아노 건반을 보면 도는 라부터 반음 3개를 더한만큼의 주파수를 가지게 된다. 따라서, 도의 주파수를 X라고 한다면


log X = log 2 * (3 / 12) + log 440

X = 10 ^ (log 2 * (3 / 12) + log 440)

X = 10 ^ (log 2 * (3 / 12)) * 440 = 523.2511 (Hz)


즉, 1초에 523번 두드리면 '도' 음이 난다.
만약 시속 100km로 달린다면 1초에 28m (27.7777m)를 간다.
28Hz의 소리를 낸다면, 1m 마다 한번씩 홈을 내면 되는 것이고,
280Hz라고 한다면 0.1m (10cm)마다 한번씩 홈을 내면 된다.
즉 계산식을 만들자면, 100km/h로 달릴때는,
28m 혹은 2800cm를 원하는 진동수로 나누면 될 것 같다.


만약 도, 레, 미, 파, 솔을 연주한다면, 


도 = 라 + 반음 3개

레 = 라 + 반음 5개

미 = 라 + 반음 7개

파 = 라 + 반음 8개

솔 = 라 + 반음 10개


이므로, 각각의 Hz를 구하면

10 ^ (log 2 * (3 / 12)) * 440 = 523.2511

10 ^ (log 2 * (5 / 12)) * 440 = 587.3295

10 ^ (log 2 * (7 / 12)) * 440 = 659.2551

10 ^ (log 2 * (8 / 12)) * 440 =  698.4564

10 ^ (log 2 * (10 / 12)) * 440 = 783.9908


각각을 시속 100km/h인 초속 27.7777m/s, (2777 cm/s)에 대해서 나누면

2777 / 523.2511 = 5.3 cm (도)

2777 / 587.3295 = 4.7 cm (레)

2777 / 659.2551 = 4.2 cm (미)

2777 / 698.4564 = 4.0 cm (파)

2777 / 783.9908 = 3.5 cm (솔)


간격으로 홈을 내면 연주할 수 있다. 그리고 28m가 1초이므로 대략 9m 홈을 내면 는 0.3초정도 지속 될 것 같다.



난, 이번 문재인 정권이 과거 정권에서 있었던 공무원 혹은 극우들이 저지른 소리없이 다 들춰내 도려내는 모습에 묘한 쾌감을 느낀다.

도무지, 출근 중에 떠올랐던 아이디어가 뭐였는지 생각이 나질 않는다.

아마도, 뭔가를 해석하는 관점에 관련된 것이었는데, 출근상황을 다시한 번 시뮬레이션하고, 어느 지점을 지날 때 쯤이었는지 어렴풋하게 기억만 나지 그 상황에서 무슨 생각을 했는지 기억이 나질 않는다.


나는 원래 기억을 못하거나, 기억하기 위한 여러 연결고리를 미쳐 만들지 못한채 잊었거나, 기억할 량이 많을 정도로 버라이어티한 주제를 떠올렸거나 하는 문제겠지.

인간이 실재 일어나지 않은 일을 시뮬레이션할 수 있는 능력이야말로 인간이 현재 지구를 지배하는  지위에 올려 놓은 중요한 요소 중 하나이다. 이런 지위에 올려 놓은 역할로서 시뮬레이션은 크게 두 가지인데, 하나는 위험을 그려보는 일이고, 다른 하나는 현실에 만족하지 못하도록 계속 몰아가는 역할이다.


지금 먹고 있는 이 음식을 다음에 먹을 수 있을까. 그렇지 못할 것 같다면 그것은 위험한 요소다.

아무 위험이 없는 상황에서도, 신의 위치에 올라가지 못한 이상 현실에 만족할 수 없다.

그 상황을 극복하기 위한 역할이 시뮬레이션으로 시작한다.


+ Recent posts