늘모자란, 개발

늘모자란, 개발


문제상황


2025년 1월 16일, 머리에 잊을 수 없는 날이 하나 더 새겨지게 된 것 같습니다.

당일 아침 7시 42분 출근을 하려다가 서버에 문제가 없나? 싶어서 사이트를 새로고침해봤는데 connection refused 문구를 마주하게 됩니다
그 당시에는 대수롭지 않게 생각하여 db에 문제가 있나? docker가 꺼졌나? 하고 가벼운 마음으로 둘러보았는데 docker에 exec를 하려고 하니 input/output error라는 짧은 에러를 확인했습니다.

뭔가 이상하다 싶어서 자세를 고쳐 앉고 확인해보니 docker 컨테이너들이 있는 /dev/sdc 디스크에서 ls조차 되지 않는 사실을 확인합니다
디스크가 맛이 간거죠. 

이 디스크 문제는 단순 디스크 문제가 아니고 여러 문제를 안고 있었는데..

그전에 간단히 싴갤러스 백업 체계에 대해 기술합니다.
먼저 싴갤러스는 2017년 구축한 docker 기반의 db 컨테이너로 (no volume set) 운영하고 있습니다.

원래는 host에서 db를 돌리고 있었는데 싴갤러스 - 무중단(을 흉내내는) DB백업 시스템 구축 을 계기로 docker로 운영하고 있었습니다.

정리하면 DB 운영과 백업 체계는 다음과 같습니다

1. mysql docker container 운영
2. mysql replication을 수행하는 또 하나의 docker container 운영
3. n시간마다 replication 컨테이너를 이미지화하여 백업
4. 오전 6시부터 7시까지 mysqldump를 이용한 fulldump 수행. 압축하여 저장. output은 /dev/sdb 에 저장됨

위 시나리오대로 계속 동작했다면 참 이상적일테지만..
얼마전부터 replication과 컨테이너 백업이 중단되어 있었습니다.

싴갤러스 DB 컨테이너가 너무 커진게 문제였습니다. db 컨테이너는 180기가정도 되는데 싴갤러스 서버는 2015년형 물리 서버입니다.
당시 서비스를 함에 있어서 테라단위의 스토리지는 지나친 사치였고(2019년이나 되서야 싴갤러스 DB 크기가 20GB 언저리가 됩니다) 스토리지 가격도 비쌌기에 이런일을 예상하고 테라단위 하드를 사용할 수 는 없었습니다. 그래도 docker 운영은 필요하다 생각하여 2017년에 512GB를 증설하였습니다.

서버에 구성된 스토리지는 다음과 같습니다.

/dev/sda 220GB
/dev/sdb 235GB
/dev/sdc 512GB

처음에 docker 컨테이너가 작을때는 4시간단위로 이미지를 커밋해서 보관하는것 까지 가능했습니다. 그런데 202X년에 들어오면서 db컨테이너는 너무나 거대해졌고, 컨테이너 하나를 더 복제해 운영하는것은 물론 컨테이너를 이미지화 해서 백업하는것 조차 버거운 상황이 되었습니다

결국, fulldump 백업으로만 백업을 운영하는것으로 정하고 컨테이너의 백업은 중단합니다.

그렇게 별 문제없이 시간이 흘렀습니다. DB는 계속 커져 갔습니다
fulldump는 /dev/sdb에 저장이 되었으나, 용량문제로 어느 시점부터는 시간이 많이 지난 파일은 삭제되게 설정했습니다.
그럼에도 어느순간엔 /dev/sdb 역시 거의 가득차게 되었고 파일 백업 스토리지를 수동으로 스위치 하기로 결정합니다.

이 부분에 대해서는..
파일이 저장되는 스토리지 스위치는 거의 몇주에서 한달정도의 텀을 가지기때문에 자동화 할 필요가 없다 생각했고,
파일을 왜이렇게 많이 유지해야 하냐는 질문에는 mysqldump가 항상 완벽한 결과로 성공하지 않기때문에, 최대한 여러개의 파일을 확보하기 위해 n일만큼을 백업하는것입니다

정리하면, 문제가 벌어진 시점쯤에는 /dev/sdc에 fulldump를 수행하고 있었고, 저는 정확한 날짜는 기억나지 않지만 2월부터 /dev/sdb에 fulldump를 저장시키기 위해, 1월의 어떤날에 /dev/sdb에 있는 "모든" 백업파일을 모두 정리(삭제)한 상태였습니다. 새로 생성된 fulldump는 /dev/sdc에만 있었죠.

여기까지가 문제가 벌어진 직전의 상황이었습니다.
즉 디스크가 터짐으로서 싴갤러스는 순간적으로 모든 DB 및 스킴이 전소하는 상황을 마주하게 됩니다....

대응

평일 아침에 벌어진 일이어서 출근을 해야했습니다. 머리가 복잡했죠
제일 처음엔 디스크가 맛이갔단 사실을 부정했습니다. 일반적인 에러가 아닐것이다.. 
애써 부정하며 SMART를 조회해보니 failed 가 나와서 디스크에 문제가 있단걸 확인했습니다..

fsck를 통해 디스크를 바로 복구 시도 해도 되었겠으나, fsck시에는 디스크의 완전한 복구를 보장할 수 없습니다. 
따라서 fsck는 최대한 나중에 실행하는것으로 하고 ddrescue 를 통해 복구를 시도해보았습니다.

그런데 단 1바이트 조차 복구가 되지 않았고.. retry 옵션을 3으로 줬음에도 한번도 성공하지 못했습니다.

상기 복구를 돌려놓은 상태에서 /dev/sdb에 저장되었던 full dump를 복구해보자고 접근했습니다. photorec를 받아서 삭제된 덤프파일들의 복구를 시도했고 몇몇 파일의 복구를 성공했습니다.
10여개정도의 gz파일을 얻는데는 성공했습니다만 invalid format에러가 발생하며 압축해제에는 실패했습니다. 사실상 거의 마지막 수단이었기때문에 gzrt를 이용해서 압축파일을 복구하기 시작했는데, 복구된 파일을 한참걸려 열어보았더니 8/10은 깨져있었습니다..
- 기본 파일의 용량도 너무 거대해서 복구도 오래걸리고 압축해제도 오래걸려서 진짜 다시는 안하고 싶은 경험입니다

여기까지 했을때 거의 오후 두시쯤이었고, 더 이상 해볼 수 있는게 하나도 남지 않았습니다
하나 빼고 말이죠..

싴갤러스의 서버는 분당 KT IDC에 코로케이션으로 관리되고 있습니다.
관리업체에 연락을 드려 상황이 이러하니, 서버에서 디스크를 탈착 후에 다른 PC에서 인식되는지 확인을 요청드렸습니다. 
이때쯤엔 소프트웨어 문제라기보단 하드웨어 이슈 (커텍터 연결 불량 등..) 에 걸어보았던 것 같습니다. 
업체에서는 우분투 PC가 없어서 세팅을 해서 봐주시겠다고 하더군요. 상황이 안좋아보여서 하시는 업무가 아니어도 해주신 것 같습니다

하지만..
관리 업체에서 (원래하지 않는 업무지만) 테스트결과 다른 PC에서도 인식되지 않는다는 말을 듣고,, 디스크를 다시 서버로 연결을 부탁드렸습니다. 그리고 서버가 다시 기동되었는데...

/dev/sdc가 멀쩡히 연결이 된 상태로 부팅되었습니다...
진짜 무슨 이런 경우가 다 있나 싶었습니다. 마냥 그냥 기뻐할수도 없는게, 문제의 원인을 모르니까 이 상태로 서비스를 돌려도 되는지 머리에 잔뜩 물음표가 새겨졌습니다. 말씀드렸지만 싴갤러스의 DB는 전소한 상황이고 복구(?) 된 디스크에 모든걸 걸어야되는 상황인것이죠. 따라서 당장 서비스를 돌리는건 포기하고 해당 디스크의 백업을 준비하기 시작했습니다.

백업을 위해서 관리센터에 문의했으나 그런 업무는 하지 않으신다고 하여, 21시부터 다음날 (금요일) IDC 방문하려고 준비를 시작했습니다.

백업 플랜은 심플했습니다.
clonezila 를 이용하여 서버를 재시작하고, 외장하드로 핫 부트한 이후, /dev/sdc의 디스크 섹터를 새로운 외장하드로 복사하는것이죠.
저는 가진 외장하드가 없어서, 조금이라도 시간을 줄이려고 즉시 쿠팡으로 구매했습니다 (새벽에 도착)

그런데 현실적인 문제가 또 발생했는데,

* IDC방문은 전일 신청해야 함
- 방문시간은 09시부터 18시까지로 한정되며 평일만 가능
- 21시에 요청은 불가능 (당직자가 해당 업무를 처리할 수 없음)

따라서..
다음날인 금요일 09시에 방문 신청을 한다고 해도 그 다음날은 토요일이라 방문할 수 없습니다. 그 다음날도 일요일이라 방문할 수 없습니다..
그럼 월요일인데 월요일에 방문하면 서버는 이미 거의 4일을 멈춰있는 상태가 되고 저는 연차를 소모해야하며.. 생업에도 지장이 생기죠..

결국 이 대목에서 원격 백업을 진행하기로 합니다. 맛이 가면 하드 뜯어서 업체에 맡기자는 마음으로 할 수 있는걸 해보자는.. 도박이었는데요.
제 컴퓨터는 윈도우 컴퓨터라서 일반적인 ftp로 파일을 옮길 경우 symbolic link등이 문제가 될 수 있어 윈도우에 wsl을 세팅, 이어서 openssh 클라이언트를 설치하고, rsync로 /dev/sdc의 파일을 모두 옮기기로 결정합니다. /dev/sdc의 용량은 310GB정도였습니다

그전에 SMART 도 멀쩡한것을 확인하고, testdisk를 이용해 20분짜리 긴 테스트도 진행했으나 OK가 나왔습니다.
그래도 만일에 대한 불상사를 위해 쿠팡으로 받은 외장하드에 clonezila 이미지를 설치해 핫 부트 할 수 있도록 준비했습니다.

엔터 한번 남은 상황에 고민하다가 날짜가 바뀐 0시 20분경쯤 rsync 작업을 시작했습니다. 계산상 6시간정도가 걸리더군요.
날밤을 깔순없어서 결국 새벽에 한번씩 일어나서 살펴보는걸로 결정, 2시, 4시쯤 일어나서 살폈는데 잘 진행이 되고 있어서 다행이었습니다

그리고 아침에 모든 파일이 백업된것을 확인했습니다.정확히는 166KB정도가 옮겨지지 않았는데 영향은 미미할거라 생각했고,
fsck 를 통해 디스크 전체 복구했습니다 (하나도 문제가 없다고 나와서 허탈했습니다...)
이후, docker 서비스를 올려서 싴갤러스 서비스가 제대로 기동되는것을 확인했습니다.

TOBE


서버신이 도와 겨우 복구(?)가 되었기에 이런일이 벌어지지 않도록 백업플랜을 다시 설정해야했습니다.
싴갤러스는 수입이 적지만, DB가 큰 프로젝트입니다. 이정도 규모 프로젝트를 외부에 업로드한다던지 하면..(사실 거대 서비스에 비해 크지도 않습니다만) 그 즉시 손해가 발생합니다. 따라서 자력으로 해결해야하는 제약이 있습니다.

용량없어서 중단하는 그런 불상사는 없도록 해야겠으니 가진 재원에서 최대한의 퍼포먼스를 내야합니다

먼저 IDC 방문을 위해 구매했던 외장하드를 사용하기로 합니다. 이미 파일까지 써버려서 환불할 수 없는 상태였거든요
저희집 공유기에는 USB포트가 있어 외장하드를 연결하면 FTP 서버 처럼 쓸 수 있단걸 깨닫고는, ddns를 설정해주고 외부 환경에서 파일을 업로드 하고 지울수 있는 스크립트를 생성하고 테스트 완료했습니다. 간단히 1TB 짜리 FTP 서버가 구성된 셈입니다

그 다음은 /dev/sdb에 저장되던 fulldump를 /dev/sda로 돌렸습니다. 메인 디스크이지만 잠깐 머물다 간다는 느낌으로 서버에는 한두개정도만 남기고, FTP 서버로 전송하도록 했습니다.

그 이후, mysql replication을 다시 잡아주기로 했습니다. 컨테이너는 백업을 위해 볼륨을 다시 설정할 필요가 있었으므로 db 이미지를 다시 받고, 컨테이너도 볼륨을 /dev/sdb를 바라보게 하여 도커 컨테이너를 새로 만들었습니다. 이로서 primary는 /dev/sdc에, 백업용 replication 컨테이너는 /dev/sdb에서 돌게함으로서 디스크를 이중으로 쓰게 설정해서 이번과 같은 디스크 폭발 사고에도 대응할 수 있게 했습니다

그 이후에는 mysql replication을 다시 먹이고 master의 데이터를 밀어넣기 시작했습니다.
데이터가 크다보니 이 과정도 너무나 오래걸렸습니다.... 

아무튼, 그렇게 백업용 replication 컨테이너를 만들었고, 마무리 했습니다. 

기존에는 다음과 같이 백업을 진행했습니다.
/dev/sdc -> fulldump / main db container / backup db container(stopped)

사용하는 디스크는 다음과 같이 변경되었습니다..

/dev/sda -> fulldump + backup ftp server
/dev/sdb -> backup db container
/dev/sdc -> main db container

느낀점

장애를 해결하고 백업 플랜을 세우면서 싴갤러스라는 서비스에 많이 무심했던 것 같습니다. 그게 사실이고..
open api 도 나오면서 사이트 정체성도 좀 무너지는것 같고, 홈페이지 디자인과 기능이 옛날 옛적에 정체되어있는것도 알고 있습니다. 안타깝지만 저도 어렸을적 어른들이 비겁한 변명을 한다고 생각했던, '바빠서 그렇다' 는 말을 하게 되는것이 참 묘한 감정이 들게 합니다.

생업이라는 변명에 숨어 안일하게 살았던 것 같습니다.
당분간은 계획한 백업플랜이 제대로 동작하는지 확인하고, 여유가 생기면 싴갤러스 기능을 개선하도록 노력하겠습니다.
서비스 이용에 불편끼쳐드려 죄송하고 열심히 하겠습니다.
2025/01/19 12:59 2025/01/19 12:59

시작하며

싴갤러스가 햇수로 올해로 10년, 그간 싴갤러스를 되돌아보고 정리한적은 없는것 같아요. 이깟게 뭔지.. 하는 생각이지만, 오랜세월 함께 해왔는데 한번은 정리의 시간이 필요하지 않나해서 글을 작성하게 되었습니다.
기술적인 얘기도 좀 적을거라 글이 재미없고 길어질것 같은데, 소고(小考)가 아닌, 아주아주길어질것만 같은 기분이 듭니다.

배경 - 늘모봇

정확히 2008년, 늘모봇이라는 hanirc 내에서 서비스를 시작하면서 일은 시작되었습니다.
07년부터 오게임이라는 게임의 정보 스크립트를 제작하고 있었는데, 많은 이들에게 더 다양한 서비스를 제공할 수 있으면 어떨까? 하는 생각에 탄생한 늘모봇 서비스.
퀴즈라는 컨텐츠로 큰 성공을 거뒀고, 이런말을 스스로 하긴 부끄럽지만 irc를 대표하는 봇 중 하나였다고 생각합니다.




늘모봇은 mIRC라는 윈도우 기반 IRC 클라이언의 자체 언어인 msl(mirc-script language)로 제작되었습니다.
사실 이 클라이언트를 이용해 봇을 제작하는 사람은 아무도 없습니다. 왜냐면, 윈도우 기반의 프로그램이기때문에 더미 메모리가 너무 많고, 시스템 구조가 불편하기 때문입니다. 또한, 한개의 IP에서는 2개까지밖에 접속할 수 없다는 제약이 존재하기때문에 배포할때도 일일히 실행해야 된다는 점도 한몫합니다. (실제로, 늘모봇'만' 돌리기 위해 8대의 VM을 사용했습니다. 자원낭비, 과대포장 갑...)

헌데 왜 이런 봇을 만들었느냐? 당시엔 할줄아는게 너무 없었기때문입니다. C를 하긴했는데 소켓은 모르고, 소켓을 하자니 통신도 모르고..
다 생각안하고 그냥 덤벼들자니 IRC에 존재하는 raw event들을 일일히 처리하기가 더 귀찮았습니다. 그래서, 이미 다 구현되어 있는 mIRC로 부딪혀 봤던 것 같습니다. mIRC로 할수있는걸론 거의 극한까지 했다고 생각합니다. 혼자한건 아니고, 유카리코라는 친구와 함께 구현했습니다. 봇 버전관리까지 전부 싹다 msl로 짰었는데 어우...

너무 서론이 길어지고 있는데, 여튼 퀴즈라는 컨텐츠를 만들때, msl의 기본 I/O 단위인 ini를 사용해 사용자 랭킹을 구현했습니다.
그러자 두가지 이슈가 발생했습니다.

1. 봇 클라이언트들이 자체(로컬) ini를 사용하니, 랭킹 및 문제 동기화가 되지 않는다.
2. 트랜잭션 개념이 존재하지 않으니, 랭킹을 읽거나 동시에 새로 쓰는 상황이 오면 파일이 크래시가 나며 모두 사라진다.
3. 모든 봇이 동기화된 랭킹을 사용하면서 안정화를 꾀할순 없을까?

그래서 어떻게 했느냐? 우선 무작정 도움을 요청했습니다.
ac18rt 라는 분이 처음에는 perl 을 이용한 cgi스크립트로 처리하게 해주셨었습니다. 그래서 봇들의 랭킹 동기화가 이루어졌습니다
하지만, 웹에 올렸더라도 결국 txt기반으로 랭킹을 기록하다보니 I/O에 의해 랭킹이 다 날아가는 이슈가 반복되었습니다.

결국은, penguin이 PHP-MYSQL을 이용한 웹 + DB연동을 진행하게 되었고, 제가 유지보수를 담당하게 되면서 웹을 공부하게 되었습니다.
당연히 트랜잭션같은게 없는 msl에서 하던 고민을 웹에서 구현하면 고려하지도 않아도 되서 안정성이나 기술 난이도나 웹쪽으로 점점 무게가 실리게 되었죠. (대신 무료 호스팅에서 얻을 수 있는 무료트래픽이 부족해 여러번 이사를 가야만 했다는... 건 가슴 깊숙히 묻어둡시다)
결과적으로 봇의 후반엔 거의 대부분의 기능을 웹으로 포팅하게 됩니다

배경 - 마비노기

늘모봇을 제작하면서 웹을 깨작이고 있던 와중에, 거짓말 같이 게임을 같이 했던 길드원들이 접은걸 펴고 한날 한시에 모이게 됩니다.
길드원들은 마비노기의 레이드라는 컨텐츠에 매우 주력하고 있었고, 성애가 시간표를 만드는 일을 담당하고 있었습니다. (류트한정!)
첨) 쿠쿠타이머라는 웹페이지에서는 하프만 지원하고 있었고, 임시점검등의 시간지연에 제대로 대응하지 못하는 이슈가 있었기때문에 일일히 수동으로 시간 계산 노가다를 하고 있었습니다

당시 저는 웹을 배우고 있었고, 길드원인 성애에게 건의했습니다.
가장 빠른 시간내 출현하는 레이드를 볼 수 있고, 레이드 몹 별로 필터링을 해서 볼 수 있으면 좋겠다는 아이디어를 제시했죠.
그리고 성애가 ok함으로서 2011년 7월, 어느 여름날 싴갤러스 프로젝트가 시작 되었습니다. 결국 소수인원을 위해 시작한...


왜 싴갤러스였느냐? 시크서버는 오래된 얘기긴한데..
제가 마비노기 갤러리(마갤)의 고정닉으로 활동하고 있었기 때문입니다.(현재도 고정닉 늘모는 제가 맞습니다)

레이아웃을 보시면 알겠지만 조악 그 자체입니다. 레이아웃은 정말 말할 필요도 없고, 투데이는 게임어바웃 의존도 100%.
자게는 아마 제로보드였던것 같고, 그나마 다음 서버상태에 좀 공을 들였습니다.

이땐 정말.. 보정이고 뭐고 서버에서 오는 반응 그대로 표시했기때문에 신용자체가 없었습니다.
그래도 언젠가는, 레이드를 자동화할 수 있지 않을까 하는 마음에 이것저것 알아보고 열심히 했었죠.. (웹 지식은 정말 제로에 가까웠습니다)
하지만 메뉴들을 보시면 지금 유저분들이 많이들 사용하시는 주요기능들은 하나도 없죠. 

첨1) 당시 레이드 계산은 공식이 있었기 때문에 정확한 서버 계산이 필요시 되었습니다.
첨2) 처음에는 사이트 대부분 길드원들과 유틸리티란의 언패킹 유틸리티를 공유하는데 쓰였습니다. (뭐가 있을지 궁금해하던 분들이 있었을지도..)

시간이 흐르며

가닥을 잡고 앞으로 나아가고 있던 와중에 마비노기 타임즈 TIP란에 글이 하나 올라왔습니다. 로컬로 뿔피리를 저장할 수 있다는 프로그램이었는데, 신기해하며 사용해보고 있는 와중에 이건 도대체 어떻게 하는걸까란 생각에 공부를 시작했고, 아주 간단히 흉내를 내서 csv형태로 저장하게 만들 수 있었습니다. 해당 파일을 msl을 이용해 csv를 서버에 업로드함과 동시에, csv파일을 지우도록 로컬을 구성하고, 서버에서는 오픈소스를 이용해 csv를 파싱후 DB에 저장하도록 했습니다. 

이 작업을 실시간으로 할 수 없었기 때문에, 10분의 텀을 두고 처리하도록 했습니다. 기억하실진 모르겠지만 갱신 10분텀은 이 때문에 발생했었습니다. 그러다가 패킷에 대한 지식이 많이 없던 저는 밥도 안먹고(--) 이틀동안 패킷공부를 하여 지금 시스템의 근간이 되는 프로그램을 만들 수 있었습니다. (이 과정에서  뿔피리가 실시간이 되었습니다. 현재는 더 많이 개선되었습니다.)


여전히 조악하죠? 이름도 tRader였는데 당시엔 ~러 어투가 유행이어서 일부러 뿔피리러라고 붙였는데 인기가 있어서 이름은 유지했던 것 같습니다. 익숙한 이름도 제법 있군요. 공부한걸 응용해서 던배른 와쳐를 만들고, 이때부터 생긴걸 의식해서 레이아웃을 바꾸고 그랬습니다. 다른 기능은 제공하지 않는 타갤러스도 이때 부터였습니다.(이때쯤엔 룬다,골렘, 모리안 서버도 서비스했습니다. 아래는 타갤러스 화면)




요거는 모바일 싴갤러스입니다. 주소도 다르게 뒤에 /m/ 으로 했는데 그땐 그게 대세였죠



레이드도 이때쯤엔 공부한걸 기반으로 완벽히 시간 계산을 하기 시작했습니다. 위 이미지는 싴갤러스 v3 때인데 이 레이아웃을 쓰기 시작한 시점부터는 더 이상 성애의 시간표는 필요 없을정도로 계산을 자동화 하는데까지 성공했습니다. 되도않는 웹표준이라고 마크도 붙여놨군요.
그리고 이제 따로 올리진 않겠지만 수야의꽃을 꼬드겨 블로그에서 개선된 지염도서관을 만들었고, 특별조나 음벞시뮬 같은 큰 기능들을 넣어가며 공부를 하고 동시에 저 스스로도 성장하는 계기가 된 것 같습니다. 가끔은 신기능이 되게 느린데 이것저것 꼼꼼히 검토하느라 그렇습니다.. (게으름 필때가 더 많습니다마는..)

서버 구조

싴갤러스의 시작은 PHP-MYSQL 구조로 시작되었습니다. 웹 구조는 현재도 비슷하고요. 당시엔 코딩 능력도 많이 부족했기때문에 배치 작업들도 전부 PHP로 만들었습니다. cron을 이용해서 php를 실행하게 .. 심지언 php 커맨드를 쓰는게 아니라 wget으로 호출시켰습니다.. 이후 배치 작업은 쉘파일이나, python 과 같은 언어로 대체되었습니다. (서버체커의 경우 아주 대대적인 성능개선을 수행했습니다. 티는 안나지만...)
모바일 푸시나 웹푸시를 담당하는 nodejs 서버가 두개있고, 별개의 다른 로직을 처리하기 위한 3개의 docker 컨테이너가 있습니다.

맨땅으로 시작을 했던거라 DB 최적화나 구조등에 대해 고려하지 않고 만들었기때문에 성능이슈가 빈번했고, 성능뿐 아니라 안정성에도 많은 장애가 있었습니다. 이를 해소하기 위해서 mysql 은 이중화 (replication) 되었고, 전체 db 형상들은 docker 컨테이너로 관리하고 있습니다. 적고보니 컨테이너가 꽤 많네요. 그외에도 c 및 c# 같은 언어들도 많이 사용되었습니다. 처음에 비하면 꽤 많이 복잡해졌습니다. 사이트 덩치가 커지면 커질 수록 처음보는 장애들을 마주했고 커널패닉이 떠서 자료가 전소되기 직전의 위기도 있었습니다.

호스팅을 받아서 쫓겨나기도 하고 이리저리 옮겨다닌 날도 있었으나 지금은 2대의 물리 서버에서 동작하고 있습니다. IDC도 다름.. (출세함)

여러가지 시도를 했습니다.

페이스북을 운영하기도 했고, 옐로우 아이디(카카오톡 + 채널), 트위터, 문의채널, 무엇이든 말해요 등등 여러 유저분들의 소리를 듣고자 했는데 사실 잘 되진 않았습니다. SNS 운영은 아무나 하는게 아닌것 같아요. 아직도 활성화되지 못했고 ... 기술적으로 궁금한걸 많이 해본것 같습니다. 요즘은 잘 안하지만 당시에 핫했던 Logstash - MYSQL bridge를 통핸 Elastic Search 를 연동까지 거의 다하고 취소했던 기억같은...  데이터 메세지들을 처리하기 위한 kafka 검토등... 등등......

앱을 만들었던것도 도전 중 하나였습니다. 당시에 앱은 내고 싶었는데 처음부터 만들기에는 너무 삽질을 하게 될거같아서 (API를 따고 연동하고 하는게...) 웹을 그대로 보여주는 하이브리드 앱으로 만들기로 결정하고 보여지는 부분을 많이 다듬었습니다. 그리고 약간의 토큰 작업들을 하고.. 이때 친절한주인, Jake가 많이 고생했습니다.

브라우니라는 거래 게시판도 만들고 있었는데, 앱이 꼭 필요하다 생각해서 작업을 했었으나.. 여가부에서 성인이 아닌사람들의 사이트 제한을 해야 된다고 답변 받아서 접었던 기억이 납니다. 외압아닌 외압에 이제... 접게된 최초의 사례인데 이건 글로 남겨놨습니다.. 여가부 남자직원이 아덴으로 설명을 해주시더군요.. (현거래가 아니어도 제재 대상..) 

관련글:
싴갤러스 가판대(브라우니) - 리뉴얼에 대해 고민하다
싴갤러스 - 하나의 기능 리뉴얼을 준비하며 (1)
싴갤러스 - 하나의 기능 리뉴얼을 준비하며 (2)

받은 질문 모음

Q. 게임도 안하는사람이 굳이 고생해서 좆망겜 관련사이트 운영하는 이유가 뭐임?
A. 게임은 2011년에 싴갤러스를 하면서 접었습니다. 우선 염려되었던게 좆목에 휘말릴까봐도 있었고 다행히도 당시에 게임에 대한 애정이 많이 식은 상태였습니다. 아본과 세공이 막 나오던 시절이었는데 세공에 투자할 재력도 없었고, 실제로 현실에서 많이 바빴습니다. 그래서 게임을 정리했던건데 결과적으론 접어서 다행인거 같습니다.

운영을 계속하는 이유는 보람이 젤 크지 않을까 합니다. 우리가 설계하고 기획한 기능들 (거의 대부분 유저분들의 자료를 긁어모으지만)이 잘 쓰이는걸 보면 기분이 좋습니다. 뭐 그게 다 인거같아요.

Q. 사이트 원리가 뭐에요
A. 네트워크 공부를 하시면 누구나 쉽게 할만한 기술들입니다. 마비엔 초고수들이 아주 많으나 그냥 다들 하기 귀찮아서가 아닐까... 싶습니다.

Q. 개발 및 유지보수는 혼자하나요
A. 처음엔 그랬는데 지금은 도와주는 드자이너들도 있고, 앱같은경우는 개발은 직접하지 않았고 유지보수는 맡아서 하고 있습니다.

Q. 트럭시위때 사이트는 왜 닫은건가요
거상 팬 커뮤니티중에 '파란만장 거상' 이라는 카페가 있습니다. 이 카페는 공식사이트보다도 더 큰 영향력과 지분을 가지고 있는것으로 알고 있는데, 약 1주일간 운영에 시위의 의미로 카페를 닫은적이 있습니다. 그 결과로 게임사에서 운영개선을 약속했던것으로 알고 있습니다.
마비노기는 유저층이 모두가 꼭 전투나 생활을 할 필요가 없어서 이해 관계가 나뉜다고 생각합니다. 따라서 관심없는 유저들은 세태를 끝까지 모르게 될것이라고 생각했고, 상황을 알리고 정리하는 지면의 역할을 해야겠다고 생각했습니다.

Q. 광고 수입은 얼마쯤 되나요
A. 서버 비용을 제한 광고 수입은 월 10만원 정도입니다.
도메인 결제가 겹치게 된다면 한 5만원정도로 잡는게 맞지 않을까요? 현재는 애플에 서비스하고 있지 않아서 이정도이고, 애플 결제를 진행하면 한 3만원대..의 수입이 있지 싶습니다. 그래도 치킨한마리는 먹는거 같네요.

아시다시피, 싴갤러스는 중간 컨텐츠에는 광고를 삽입하고 있지 않습니다.  총 광고는 4개이나, 화면이 1920 사이즈로 풀 확대되었을때 양쪽 세로에 두개가 출력되고, 그게 아니면 페이지의 가장 상단 및 하단에 출력되는 구조입니다. (특히 하단은 사이트가 스크롤이 많기때문에 거의 출력안되는거 같습니다)

그래서 밥벌이는 세로로광고로 거의 하는거 같고, 본문의 광고로는 수입이 거의 발생하지 않습니다. (생각보다 인터넷 창을 다 키워놓고 하는 분들이 많아서 놀랬습니다) 

Q. 기억에 남는 썰이 있다면?
학교 다닐때 용돈을 받아서 생활했었는데, 당시에 서버비를 내고 나면 컵라면 두개를 살 수 있었습니다. 주말동안 컵라면 두개로 살아야했는데 다 먹어버리면 끼니 해결이 안되니까 ㅋㅋㅋ 컵라면을 반반씩 쪼개서 먹었던 기억이 있습니다. 불쌍하다고 후원해주셔서 해당일엔 치킨 먹었습니다. 아직도 호르헤님 닉이 안잊혀지네요...

두번째로는 훈련소 들어가있는데 인터넷 편지로 서버 터졌다고 관리자중에 한명이 에러 메세지를 적어서 보내줬었습니다... 장황하게...
어떻게 고쳐야 최대한 빨리 고칠 수 있을까 원인은 뭘까 고민 및 시뮬레이션과 답답함에 미쳐버리는 시간을 보내게 해주었습니다. 고마워...

10년

10년이면 3650일인가요? 러닝타임이 그정도까진 되지 않을거 같습니다. 잠깐 닫은적도 있고.. 하지만 햇수로는 10년이 맞겠죠.
울고 웃고 많은 일들이 있었습니다. 여기까지 오기엔 혼자만의 힘으론 불가능했습니다. 도와준 관리자들에게 다시한번 감사의 인사를 드리고 또 사이트를 계속 사용해주시는 여러분들도 정말 고맙습니다.

사실은, 싴갤러스의 graceful shutdown 을 생각하고 있습니다.
마비노기 타임즈나 쫀득쫀득 인챈트와 같이 이미 10주년을 넘긴 사이트들앞에서 주름잡는게 조금 민망합니다.

커뮤니티들이 떠오르고 지고를 많이 반복했습니다만 그 끝은 사이트를 접은게 아니라 접힌쪽에 가까웠습니다.
접히는게 아니라, 사이트를 내손으로 접을 수 있다면, 또 내가 이 사이트를 평생 운영할 계획이 아니라면 10년이 되는 시점에서 커튼을 내리는것도 아름답지 않을까? 하는 생각을 했습니다. 그보다 적절한 시점이 없지 않을까 생각했어요.

그래서 디데이 옆 아이콘도 전원버튼을 달아놨는데요. (응원을 바라고 쓰는글이 아닙니다. 그냥 생각했던 내용입니다) 남은 시간동안 계속 생각해볼것 같은데 아마 계속 운영하지 싶습니다. 아마도...

지난 10년간 싴갤러스를 이용해주셔서 감사했고, 앞으로도 감사드리겠습니다!!
2021/04/07 10:30 2021/04/07 10:30

레이드.

마비노기라는 게임에 레이드라는 단어가 이제 어울릴지 모르겠습니다.
유저 하나하나가 너무 강해지는 바람에 체력이 못따라가는 상황인 것 같더군요..



그럼에도 불구하고 싴갤러스에서는 유저분들의 제보를 이용해 보다 더 나은 레이드 환경을 만들려고 항상 노력하고 있습니다 (진짜)
오늘 이 글에서 다룰 이야기는 바로 그 레이드 개선에 관한 이야기입니다

구조적 문제를 안고 시작하다


처음 싴갤러스의 레이드를 다룰때는 네이드, 거대사자, 거대악어, 평원 드래곤 그리고 이프리트 5종만 다루었습니다.



아마 위 레이아웃은 본적도 없으신분들이 많을 것 같은데요.
이때는 웹, 즉 PHP를 막 배우고 있을때 만든 홈페이지라 레이드 별로 페이지를 전부 하나씩 생성했습니다.
그리고 DB에서 보스별로 불러와 처리했죠. 그러니까 즉, SQL 쿼리만 살짝 다른 페이지가 5종, 전체를 볼 수 있는 페이지까지 해서 6종이죠.
그리고 자바스크립트도 잘 할 줄 몰라서 하나의 페이지를 가지고 인자를 전달해 다른 결과를 보여준다는건 생각도 못했고, 무조건 페이지 이동이 필요했습니다


js를 좀 배우고 나서도 문제가 해결되진 않았습니다.
이미 나눠진 페이지를 굳이 합칠 필요가 없었기 때문입니다. 그리고 이땐 또 ajax와 REST개념을 잘못 이해하고 있어서 ajax로 데이터를 불러오는게 아니라 페이지 자체를 그대로 불러와 대상 dom 에 씌우는 식이었습니다. 그러니까, 불러오는 페이지에서 표까지 완전히 작성하는 구조였죠.

그렇게 많은 페이지들이 만들어진 상태에서 레이드가 계속 늘어났습니다. 레드 드래곤부터 시작해서, 시간이 고정이었던 사막 드래곤, 신규 레이드인 블랙, 화이트 드래곤부터 지금의 실반 드래곤, 모쿠르칼피까지. 첫 단추를 잘못꿴 상태였기때문에 똑같은 페이지를 계속 만들어낼 수 밖에 없었습니다. 잘못된건 아는데, 빠르게 결과물을 내야했기때문에 -당시에 레이드는 경쟁구도의 사이트가 있었습니다- 속도를 올릴 수 밖에 없었고, 나중을 기약하며 조악한 페이지들을 계속 늘려만 갔죠. 그 결과는...


(여기서 strings는 작업하려고 추가해놓은거고 실제론 없었음)

raid3.php 이라는 뷰 페이지에서 page를 include 해서 보여주는 식이었고, 각 페이지에서는 각 프로세스를 처리할 (레이드 마다 시간이 다르기때문에) 페이지에 1:1로 매칭이 됩니다. 초록색은 작업하려고 만든거라 상관없고... 그러니까, 거의 20여개에 달하는 페이지로 구성되어 있던거죠... 그리고 스크립트도 PHP 변수를 사용해 처리하기때문에 인라인 스크립트로 작성되어 있고, css도 인라인 css로 작성되어 있기때문에...

단 하나의 수정이 발생하면 최소 8개 페이지(레이드가 다르더라도 인터페이스는 공통된 경험을 줘야하니까)가 수정되어야했고, 좀 심하면 처리 페이지까지 수정해야했으니 1글자를 고치기 위해 20페이지가 수정되어야 하는 기염을 토하기도 했습니다.
구조적인 문제가 분명히 있었으나, 다들 잘 쓰고 있으니까요. 굳이 수정이 안되어도 문제가 없었습니다. 어차피 레이드는 완성형이라고 생각했고, 뭐 하나 추가되면 페이지 늘려야지, 이젠 도가 텄으니 빨리빨리 수정할 수 있다 이런식으로 애써 신경안쓰려고 하고 살았습니다..


곪은건 터지게 된다


신규 기능 요청이 들어왔습니다. 별건아니고, 전광판을 여러개 띄울 수 있게 해주세요.... 인데
모든 보스몬스터가 별도로 구분되어 있기때문에 현재의 구조로는 제공할 수가 없었습니다. 정확히는 가능은 하지만 불필요한 함수를 작성해야할 수도 있고, 뭣보다 중간에 수정이 일어나게 되면 모든 페이지에 같은 내용으로 또 작성... 아... 더 이상은 얘기하기 싫네요.

그래서 이왕 이렇게 된거 레이드 자체를 다시짜자고 결심하게 되었습니다.
단 한번의 수정으로 많은 경험을 선사해주자는거죠. 결론부터 작성해보자면 다음과 같이 변했습니다.
여기에 raid.js 라는 별도로 분리된 js 파일이 하나 더 있습니다. 뷰를 담당하는 파일이 하나 더 있고요.



먼저 페이지를 통일하는게 중요했습니다.
어차피 설명만 좀 다르고 마크업은 똑같기 때문에 (아주 약간만 다르던지) assets에 strings 를 추가해 파라미터별로 설명을 다르게 표시해주는것부터 시작했습니다. 같은 이름의 변수를 case마다 계속 작성해나가는게 유쾌한 경험은 아니었지만 필요한 작업이니까, 좋게 말하면 string을 분리한거고, 나쁘게 말하면 우겨넣은거죠. 그래도 다음과 같아졌습니다.



이제 이 수많은 print_보스들... 왜 이럴까 소스를보니 초반부는 다른데 후반부는 완전 같습니다.
이상하네 하고 보니까(내가 짠건데 이상하네라고...) 그냥 시간을 체크해서 레이드 시간인지 아니만 판단하는 부분만 다를뿐 모두 같더군요.
그리고 이상하게 뿔피리데이터를 이쪽에서 만들고 있었는데 검색 키워드만 조금씩 다르고 쿼리도 같고요. 자갈치 시장도 아니고 한번에 처리하려고 발악을 한 느낌이었습니다. (print_smd_data , print_smd_horn 이렇게 안하려고...?)

해야할건 명확했습니다. 각 보스별로 시간 체크 및 시간, 제보 정보를 합치고, 뿔피리 데이터를 분리해 처리하는 두개파일로 나누는거죠.
그리고 전광판을 여러개 띄웠을때도 같은 페이지로 온전히 동작해야하니까 범용성을 살짝 넣고.

그렇게 서버에서 주는 값들을 대강 명세하고, js 를 수정했습니다.
기존엔 js안에 서버 변수를 넣어서 그대로 작성한 케이스가 많았는데 이번엔 어떤 서버변수도 사용하면 안되었기때문에, url 을 이용해 구분했습니다. 그리고 대부분의 DOM을 dynamic 하게 만들어야했기때문에 js안에 html div를 많이 작성했습니다. 이게 맞는 방법인진 모르겠는데.. 맞겠죠?;

js를 작성하면서 느낀건데 multi line을 작성할때 쓰는 ` (back qoute)와 new URL, filter arrow 등은 IE에서 사용할 수가 없었어서 다 만들었다 생각했는데 대체하기 위해 다시 작업을 하고.... 뭐 그랬던거 같네요. 그리고 신규 관리자분이 들어왔는데... 시련이 시작되었습니다. css 지옥이었는데.. 봐주는 관리자 한명이 잠을 안자...




화면을 같이 보고 있는게 아니라서 캡쳐 후 보여주기를 계속 반복해야했고 결국 대화방 앨범이 이거 관련 내용으로 한페이지를 넘게 차지하게 되더군요. 개인적으로 디자인 작업은 안좋아하기때문에 아주 많이 힘든 시간이었습니다.... ㅠㅠ
신규 기능 추가를 마치고, 테스트 서버에서 기능이 실제 데이터 기반으로 잘 돌아가는걸 확인하고 기능을 릴리즈 했지만 IE 호환문제, 창이 자동으로 안뜬다던지, 채팅 제보 정규식에 문제가 있다던지 하는 소소하면서도 안되면 불편한 문제들이 계속 발견되면서, 한번에 완벽하긴 정말 어렵구나 하는 생각을 했습니다

돌아보며


금번 작업은 보기엔 별거 없습니다. 기능한개가 추가 되었고, 사이트 외형적으로도 거의 변한게 없습니다.




그러나,
5,000여 라인의 코드 삭제가 있었고, 2,200 여 라인의 코드 작성이 있었습니다.. 이 작업은 단 이틀만에 수행되었고요..
훨씬 많을줄 알았는데 이거밖에 안돼 같은 생각이 들지만, 범용성을 위한 코드 리팩토링은 싴갤러스를 운영하면서 처음인거같습니다.

코드자체가 대단한것도 아니고 난이도가 있는 코드도 아니지만, 짧은 시간내에 끝내려고 일정을 빡빡하게 잡았고, 오히려 시간이 타이트했기때문에 한줄한줄 쓸모없이 작성하지 말자 이렇게 임했던 느낌입니다. 유저 수요도 고려하고, 중간에 기획을 바꾸기도 하면서..
개인적인 성취를 이룬 느낌이 더 강한 업데이트였습니다. 구조 통일도 했으니 앞으로 레이드쪽에 더 많은 기능 추가가 있을....수도 있겠죠?

다음엔 더 재밌는 글로 찾아뵙겠습니다~
2018/09/17 09:43 2018/09/17 09:43

앱 업데이트는 매번 참 두근거리는 일입니다. 
검수를 받기때문에 웹 처럼 빠르게 업데이트가 불가능하고(상대적으로), 기기의 이상 유무, 앱 설치와 제거 여부등 보고 있자면 흥미로운 통계가 많기 때문입니다.

사실, 싴갤러스는 모바일 레이아웃을 지원하기때문에 네이티브로 앱을 구성할 필요가 없고, 굳이 쓴다면 푸시 기능때문에 앱을 존속시키고 있는 것인데요. 그래서 그런가 많은 공수를 들이고 있지 않은것도 사실입니다. 그래도 이번에는 아이콘 그림도 많이 교체했고, 자주 볼 수 없는 화면에 신경도 (...) 썼습니다. 예를 들면 서버를 선택하는 화면에서 UI의 색이 바뀐다던지하는...

기본 웹에서 지원하는 아래로 끌어서 새로고침하는 기능도 넣어보았습니다. 이젠 당연하게 여겨지는 기능이고..
또, 안드로이드에서 갑자기 네트워크 문제가 발생했을경우 에러 다이얼로그 폭탄이 나오는 문제들도 수정했고, 캐시가 계속 쌓여서 앱이 비대해지지 않도록 신경도 써봤습니다.

그외에도 뭐 ... 다 말하지 못하는 사소한 것들도 참 많습니다만 어쨌든, 싴갤러스 1.13 앱을 즐겨주세요!
2018/09/11 09:14 2018/09/11 09:14
사건 발생
지난 10월 25일 0시경, 사이트가 이상하다는 말을 듣게 되었습니다.
확인해보니 MySQL 서버가 말썽, 근데 좀 이상합니다. 잘될땐 잘되는데 새로고침할때마다 DB가 에러를 throw하고 있는데 왜지..?
가끔은 no such file or directory도 뜨고, too many connections도 뜨고.. 그리고 gone a way도 뜨는 등 난리도 아닙니다. 도대체 무슨일이 일어난걸까요.

서버 다운
처음 의심했던것은 MySQL 을 5.7.20으로 업그레이드 했기 때문 아닌가였습니다. 그런데 업그레이드는 아침에 이뤄졌고, 오류가 난건 거의 15시간이 지난 이후.. 연관이 없어보입니다. 아직도 업그레이드 했기때문에 터진게 아닌가 하는 강력한 의심을 가지고 있지만, 어쨌든 사건에 집중해봅시다.

제일 먼저 사이트를 활성화 시켜야했습니다. 뭐 할때마다 에러가 나는데 되는것도 아니고 안되는것도 아닌 기괴한 상태가 지속되고 있었습니다. 쉘에서 MySQL에 붙으려고 해도 too many connections로 붙을 수가 없을정도로 이미 점거 당한 상태. 보나마나 process에 행이 걸려서 뒤의 요청을 처리 못하고 있는 것이겠지요. 도저히 확인을 할 수 없을정도로 밀려들어오니 일단 웹서버를 내렸습니다. (어차피 서비스가 정상작동하고 있지도 않았습니다)

이제 살펴보자
서버를 내린 이상 시간끌리지 않고 최대한 빠르게 문제를 확인해야 했는데 에러로그를 보니 메모리 관련해서 에러가 찍혀 있었습니다. key buffer size를 조절하라.. 뭐 memory trap 이라고 적힌거도 있고, because you hit a bug 이런식으로도 쓰여있는데 아니... 그래서 뭐가 문제라는건데... 정작 유추할 수 있는 에러로그는 없고 미칠 노릇입니다. 친구말로는 메타데이터 파일이나, 권한 문제가 일어났을 수 있다고 하던데 (바로 며칠전에 비슷한 에러를 겪음) 문제도 없었습니다. 

일단 뭐가 깨져도 깨진건 확실합니다. MySQL에서는 innodb 엔진을 쓰는 경우 1~6 레벨(?)까지 강제 복구 옵션을 지원하고 있습니다. recovery 레벨을 설정하면 read-only가 되는데 이때 살릴 수 있는거라도 살리려면 mysqldump해주는게 좋습니다. 저도 데이터를 일단 백업해야겠다는 생각에 mysqldump로 DB를 하나씩 덤프뜨긴했는데 특정 DB에 접근하니 바로 dump가 중지됩니다. select를 못한다는거죠. 어떤 DB가 깨졌구나하고 대강 범위를 좁힐 수 있었습니다.

2017-10-25T01:35:15.821493+09:00 4 [ERROR] InnoDB: Failed to find tablespace for table [ ] in the cache. Attempting to load the tablespace with space id 23958


왜 범위를 좁혔냐 하면, 위 로그는 전혀 상관없는 DB에서 났기때문입니다. 아마 하나가 깨지니 뒤에 따라오는 테이블을 모두 읽지 못하는 현상이 아닌가 싶은데.. 범위를 줄여나가는게 중요합니다.

그다음에는 .ibd 및 .frm을 모두 cp한후에, 문제가 일어났을것이라 생각하는 db의 내용을 모두 지우고, MySQL을 재시작해 싹 밀고, 다시 붙여넣어봤습니다. 해당 DB가 없으니 기가막히게 잘 굴러갑니다만 다시 데이터를 넣자마자 바로 db가 재시작되어버립니다. 여기서 ibdata가 박살이 났구나하고 감을 잡을 수 있었습니다.
보통은 이럴때 mysqlfrm을 사용해 테이블 구조를 새로 만들고, 데이터를 다시 밀어넣는식으로 복구합니다만, 저 같은 경우는 테이블 수도 많고, 일단 db에 select를 하면 db가 재시작되어버리기때문에 별 의미가 없다 생각했습니다. (사이사이 frm및 ibd 데이터를 하나씩 넣어서 산 테이블을 확보해보려했으나 거의 소용없는 짓이었습니다). 메모리 에러 일 수 있을것이라 생각해 서버 재부팅도 두번이나 했으나.. .안되네요.

결국 여기서 손을 들었습니다. ibd와 frm이 있지만 애초에 붙어지질 않으니 복구할 수가 없구나. 마지막 백업이 언제지? 아침 6시입니다. 그리고 새벽까지 삽질하고 있었으니 그 동안에 누적되지 못한 로그들도 많으니 문제가 된 DB는 최대 24시간정도의 데이터 유실이 발생합니다. 사이트는 다시 돌지만, 뼈아픈 경험입니다. 24시간마다 백업이 돌고 있으나, 유실될 양을 생각해보면 터무니 없이 부족합니다. 어떻게 해야할까요?

무중단 백업은 어떻게?
4년전 쯤에서는 MySQL의 replication을 활용하고 있었습니다. 이때는 DB쿼리가 최적화 되어있지 않아 쿼리한개가 DB를 잡아먹던 시절이기도 하고, VPS에서 사용했기때문에 서버 사양이 워낙 안좋아 시도때도 없이 DB가 죽을때가 있었습니다. 정확히 다시 말하면, 백업이 아니라 cpu 와 메모리 사용량을 분산시키기 위한 cluster개념으로 replication을 사용했습니다.

그러나 세월이 꽤 흘렀죠? 문제가 된 DB 쿼리도 다 수정되었고, 서버 스펙은 그때와 말도 안되게 뻥튀기되었습니다. 서버 두대를 돌릴 이유가 없으니 자연스럽게 replication 서버를 내렸었죠. 이 얘길 왜 하느냐? 지금부터 replication을 사용할 것이기 때문입니다.

왜? 기존에 사용하고 있는 mysqldump는 모든 db를 full select 합니다. 또한 쿼리 캐시 옵션을 비활성화하기때문에 DB에 심각한 부하가 발생하며, 사이트 전체의 성능저하도 일어납니다. 따라서 백업텀을 줄이면 안되겠느냐 같은 말은 사용량이 많은 시간대엔 절대 먹히지 않는 말입니다. 고로, 부하가 발생하지 않으면서도, 실시간 백업을 할 수 있는 방법 = 데이터가 insert되면 다른 데이터베이스에 저장하는 방법은 뭐가 있죠? replication입니다. 그래서 docker를 이용해 가상 서버를 하나 만드는걸로 진행합니다.

다음과 같이 변경했습니다
모든 과정이 매끄럽게 진행되진 않았지만, 주말동안 작업해 적용된 내용은,
Replication 서버를 돌려서 한쪽 DB가 맛이 가더라도 관리자 확인하에 즉시 DB를 변경할 수 있게 변경했습니다.
서비스 중일때 발생하는 dump 백업의 텀을 3시간으로 줄였습니다.(기존 24시간)
마지막으로, 서버 이미지를 하루마다 저장해 허브에 푸시합니다. DB 두개가 한번에 박살나도, 최대 10분내에 복구가 가능합니다.(순수하게 다운로드 시간)

얻은 결론
서버 용량이 풍족하진 않습니다. 이번 구성으로 인해 꽤 많은 용량을 차지하게 되었습니다만... 서버 용량이야 좀 더 자주 확인하면 되는 것이고, 밤을 안새게 해주진 않습니다. 또한 사용자 여러분들의 사이트 사용에도 차질이 없도록 만반의 준비를 했어야 했는데, 진작해야할 일을 이제야 한 것 같습니다. 좋은 교훈을 얻었다 생각하고, 서버 안정화에 더 힘쓰겠습니다
2017/10/26 10:02 2017/10/26 10:02
마비노기라는 게임이 다른 게임과 차별화되는 점이라면 바로 색이 아닐까요?
어떤 아이템이던 유저들이 원하는 색으로 커스터마이즈 할 수 있다는 점은 게임 출시 직후나 지금까지도 신선한 시스템임에 틀림없습니다.

자유롭지 않은 색상

아시겠지만, 마비노기의 색상 선택은 완전히 자유롭진 못합니다.
게임 운영진이 정한 팔레트내에서 염색이 되기 때문입니다. 이렇게 미리 정의된 색상들은 착용할 수 있는 모든 부위에 존재합니다.
(몬스터 드랍의 경우는 다른 팔레트를 사용합니다. 때문에 오리지널 색상에만 있는 색도 존재합니다)

외국 마비노기 커뮤니티에 잘 쓰여진 Mabination의 글이 있어 소개하겠습니다.
우리에게 익숙한 다음과 같은 팔레트가 있습니다

천옷 염색 팔레트

이런 팔레트는 어떻게 매번 인터페이스를 열때마다 다르게 생성되는것일까요?
팔레트들의 원형이 되는 이미지가 아이템 부위별로 존재합니다.

천옷 팔레트의 raw data

미리 정의된 색상이 있고, 이를 다음 연산을 통해 비틉니다

팔레트 생성 그래프


이를 똑같이 생성해내는 wrapper 가 있으나 이것까지 알 필욘 없고..
(사실 잘 모르겠습니다. 모의 염색 시뮬 만드는 날이 올 수도 있지 않을까요?)

저희가 주목한 사실은 팔레트의 raw data가 미리 정해져있다는 것입니다. 즉, 한 픽셀씩 이동하며 색을 추출해내면(혹은 라이브러리를 이용), 일반 앰플로 염색할 수 있는 색상을 추출해낼 수 있을 것이라 생각해 작업을 시작했고, 각 타입별로 다음과 같은 유니크한 색들이 존재함을 알 수 있었습니다.

타입 갯수
천옷 13,536
야광 39,452
가죽 9,975
실크 9,711
금속 7,858

더 많은 파트를 확보할 수도 있었으나, 가장 많이 사용되는 파트를 뽑았습니다. 그 마저도 요새 나오는 아이템들은 전부 천 파트라 야광과 실크를 할까 말까 고민을 많이 하기도 했는데요. 그냥 다 넣는걸로 했습니다.

이제 붙일 내용은 준비가 끝났습니다

처음에는 이렇게 만들려고 했습니다



제일 처음에는 앞서 설명한 내용만을 가지고 구성했습니다.
그런데 보기가 너무 불편해서 다음과 같이 그림으로 나타내볼 생각을 했습니다.


그러다가 문장 하나를 적었는데 비슷한 색.. 비슷한 색.. 이 블로그에도 내용이 있지만 color difference를 가지고 놀아본적이 있기때문에 충분히 뽑아줄 수 있을 것이라 생각했죠. 그래서 이 기능을 서브 기능이 아니라 본 기능으로 빼자, 넓게넓게 보여주고 지염에서도 비슷한 거도 보여주고 넓게 넓게 탭을 구성하자고 생각했고 다음과 같이 구성했습니다.


이 후에, 출처들도 누르면 검색되게 하고 글자 색도 배경에 따라 바뀌게 하는 등 변경을 했는데, 큰 변화 없이 구성을 했습니다.
여기서 UI/UX 적 고민을 하게 되었는데 과연 표시된 색을 클릭할 생각이 드냐는거였습니다. 누가 도대체 이런 색 상자 박스를 클릭할 것인가에 대한 토론이 있었고, 아이콘을 넣어보자는 의견이 있었습니다.

그리고, 여태까지 진행된 추가 검색은 모두 있는 색 상자에 대해서만 진행되었던 것으로, 완전히 존재하지 않는 색이 검색되더라도 해당 기능을 제공하기로 결정했습니다.



그래서 이런 모양을 모든 색 상자에 적용해 다음과 같은 최종 결과물로 완성하게 되었습니다.


근접 색상 검색에 대하여

그간 썼던 글을 읽으셨던 분들도 있겠지만, 싴갤러스에서 근접 색상 정렬을 위해 사용하는 기법은 CIE 2000 입니다. 헌데 색상 거리 검색이라는건 사실 이거다! 하고 명확하게 정의할 수가 없습니다. 사람이 느끼는것과 기계적(이론적)으로 판단하는것과는 꽤나 차이가 있기 때문입니다.

CIE 2000 으로 색상을 정렬했을때 다음과 같은 문제가 있었는데요.


리블 검색을 했을때 근접해서 나오는 색상에 왠 이상한 흰색이 있다는 것이었습니다. 헌데 색을 군집해서 검색하는 CIE 2000 (다른 CIE들도 비슷) 특성상, 잘못된 결과가 아니었습니다. 검정색을 검색했는데.. 흰색이 가장 근접한 색상 BEST 10 이라고 보여드릴 수는 없었습니다. 따라서 tie-break (CIE로 색을 검색할 경우 소숫점 5자리 단위에 따라서 갈라지는 경우도 많습니다)를 위해 추가 weight를 주기로 했습니다.

혹시 CIE 2000이 잘못구현된게 아닌가 싶어서 여러 언어로도 해보고, 직접 wrap을 해보기도 했는데 할때마다 맞다는 결과만..

색의 거리를 검사하는 다음 공식으로 보여줄까도 생각했지만 터무니 없는 결과만 나왔구요.

sqrt((r2 - r1)^2 + (g2 - g1)^2 + (b2 - b1)^2)


그래서 찾아다니고 실험해보다가 가장 거리가 많이 나오는 다음 공식을 추가 weight으로 결정했습니다. (최종 값은 *0.1)
이 글을 읽고 적용한건데 잘못된 선택이 아니었길 바래봅니다..

double ColourDistance(RGB e1, RGB e2) {
    long rmean = ( (long)e1.r + (long)e2.r ) / 2;
    long r = (long)e1.r - (long)e2.r;
    long g = (long)e1.g - (long)e2.g;
    long b = (long)e1.b - (long)e2.b;
    return sqrt((((512+rmean)*r*r)>>8) + 4*g*g + (((767-rmean)*b*b)>>8)); 
}

지염 도서관은 게임 시스템상 많은 수요가 있다고 생각합니다. 앞으로 또 어떤 삽질로 만나 뵙게 될지 기대 되네요.

ps. 기능을 만들던 와중에...







2017/07/20 11:03 2017/07/20 11:03


싴갤러스 - 하나의 기능 리뉴얼을 준비하며 (1) 로부터 이어집니다


게임 아이템 거래에 대한 개념을 짚어볼 필요가 있었습니다.

1. 게시판
대부분의 거래사이트에서는 게시판 레이아웃을 채택하고 있습니다.
왜냐면, 구축이 쉽고 빠르기 때문입니다. 게시글이란것은 글 내용을 눌러보기 전까지 내용을 알 수없습니다. 검색을 하지 않는다면요.
게시판 레이아웃으로 구성되어 있는 홈페이지를 사용하는 유저들은 다음과 같은 흐름대로 움직입니다.

1. 게시판 접속
2. 서버 게시판 클릭
3. 제목을 하나씩 보며 페이지를 넘기다가 클릭
3-1. 검색을 통해 원하는 내용을 검색후 제목을 클릭

유저는 어떨때 글을 클릭하는것일까요? 저는 그것이 바로 제목이 가지는 힘이라고 생각했습니다.
예를 들어 다음과 같은 제목들을 말합니다.

'여러 의장 아이템 팝니다.','의장아이템 많이 팝니다.', '싸게 처분합니다' 등으로 흥미를 유발하는것이죠.
실제 필요하지 않은 아이템이라고해도 눌러보거나, 어떤 아이템이 있나 보거나... 이 케이스로 인해 발생하는 경우는 '뜬금없이 싸거나, 원하는 옵션보다 쌌을때'와 같이 조금 특별한 경우에만 해당합니다.

2. 정보 소모 속도가 빠르다
그냥 글을 다 읽어보는 부류도 있습니다. (괜찮으면 구매해볼까~ 같은 마인드). 비슷하게도, 역시 별로 좋아보이지 않는 아이템은 휙휙 넘기기때문에 정보의 소모가 매우 빠르게 이루어진다고 할 수 있습니다. 하지만, 게시판 레이아웃대로 구성시 제목을 보고, 클릭하고, 맘에 드는 아이템이 없으면 다시 뒤로가기를 통해 목록을 조회해야하므로 최소 2번의 리프레쉬가 일어납니다.

그래서 모티브를 '한눈에 볼 수 있고, 최소한의 새로고침'으로 잡고 닿은 결론이 METRO UI였습니다.
METRO UI는 사각형들이 다닥다닥 달라붙어 잇는 형태인데, 이를 응용해 갤러리 형태로 만들면 시야에 들어오는 글은 오히려 게시판 보다 더 많지 않을까라는 생각을 하게되었습니다. 또한 작성하는 아이템을 무조건 한개만 작성하게 강제한다면, 오히려 가독성면에서 더 좋지 않을까요?



이런 형태이고, 네이버 게시글이 16개정도가 한페이지인것을 고려하면, 비슷한 내용으로 한페이지를 사용한다 할 수 있습니다.


요렇게만 나열되면 좋겠지만, 다음 그림과 같이 무작위아이템들이 올라올 경우 산만해질 수 있다는 의견이 있었고


무작위로 나열될때 격자가 아닌 이상한 형태의 모양이 만들어져 오히려 글자를 읽는게 불편한 느낌이 들었습니다. 결국 이를 보완하기 위해 여러 안을 내야 했습니다.

고민하던 와중에, 이 글을 보게 되었는데, 핀터레스트에서 사용하고 있는 카드형식의 UI를 사용하면 어떨까 했습니다.
역시 기본 아이디어는 비슷하지만, 개체 하나하나마다 변별력을 주자는것이 핵심 아이디어였습니다.

Masonry를 사용할수도 있었지만, 원하는 모양대로 잘 안나오더군요.

그리고 무한히 나오는 결과물에 대해서도 테스트를 진행해봤으나, 제대로 정렬이 잘 되지 않았습니다.
네이버의 eg를 쓰는것은 처음엔 별로 내키지 않았지만(용량문제도 있지만, 어차피 jquery를 쓰니까...), 일단 적용해보기로 했는데 생각보다 결과물이 예쁘게 나왔습니다. 사용하기도 쉽고 (세팅에 많은 시간을 필요로 하지 않음)......


뼈대밖에 없긴한데, 이만하면 원하는대로 모습이었습니다..
적용을 하면 다음 모양처럼 나옵니다. 다만 갤러리형태에 적합했기때문에 모양새가 조금은 마음에 안들었습니다. 정확히 responsive 되는것도 아니었구요. 조금 아쉬운 상황이었습니다.




여기까지 준비를 했는데!
본격적으로 일을 시작하려니 참 아쉽게 되었습니다. 

2017년 5월 22일부로 가판대 기능을 닫았습니다.

가판대 기능을 살려보기 위해 앱도 만들고, 푸시서비스도 넣고 쪽지도 만들고 이것저것 했었는데 결말이 좀 안타깝지만, 적법하지 않은 기능이라는 민원 처리 결과입니다.

보건복지부의 고시"보건복지가족부 고시 제2009-24호"에 따르면 게임아이템 거래 중개 사이트는 게임 거래를 알선하는 모든 사이트를 청소년 유해물로 규정하고 있습니다. 옛날 옛적 네이버 카페들이 문닫았던 이유인데요.

청소년들이 게임내 재화를 얻거나 팔기 위해서 많은 시간을 투자해야된다는 개념이 들어가는 이상, 현금 거래이던 아니던 적법하지 않다고 합니다. 위반하면 형사처벌이고요. 본인인증을 도입한다고 하더라도 광고 수입이 그정도도 없고, 접근성도 네이버 카페보다 뛰어날것이라고 생각하지 않습니다.

가판대 기능은 꽤 오래 유지가 되었었는데 (사용량은 아주 없었지만), 여태 신고 안당한걸 천운으로 생각해야될것 같습니다 -_-;

원래 처음 싴갤러스를 시작할때는 법령을 고려해본적이 한번도 없는데, 주변에서 쓰러져가고 고소같은거도 정보를 제공하면서 이제 단순히 의지만으로 현실을 관철할 수 없지 않게 되었나 생각합니다. 많은 아쉬움이 따르지만, 그간 준비했던 기능들은 다른 곳에  쓰일 수 있길 바랍니다. 뭐 이번에 대통령도 바뀌었는데 다시 진행하게 될 수 도 있죠. see you later!
2016/09/26 08:06 2016/09/26 08:06

시작하며


사이트를 만들고 서비스하면 잘 쓰이는 기능도 있는반면, 잘 쓰이지 않는 기능도 존재하는 법입니다.
가판대는 싴갤러스 가장 초기에 만들어진 기능중 하나였으나 사장된(...) 기능입니다.


꽤 손을 많이 탄 기능이고 애착이 있기때문에, 어떻게든 활성화 시킬 수 없을까 하고 여러 고민을 해보게 되었습니다.
(사실, 네이버 카페보다 훨씬 편하다고 생각했기 때문입니다.)

그래서 예전처럼 마구자비로 개발하기보단 생각과 고민을 충분히 해보기로 했습니다.

문제분석과 시도

1. 이름

처음엔 '브라우니' 라는 이름의 메뉴-개인상점 브라우니에서 착안-였으나 사용자들이 어떤 기능인지 잘 모를것 같다는 생각을 반영해, '싴갤러스 가판대'로 이름을 변경했습니다.

2. 편의
처음엔 스크린샷을 넣을 수 없었습니다. 당연히 글로 모든걸 설명해야했습니다. 이는 의도된것으로 스크린샷 한장만 올리는게 아니고, 옵션을 모두 치게 하면 검색이 더 잘될것이라 판단한것입니다만.. 세상에 누가 내구에 색상같은걸 다 치고 있을까요..
그래서 스크린샷을 넣을 수 있도록 개선하였습니다. 또한, 마우스클릭만으로도 쉽게 금액을 추가할 수 있도록 했습니다. 은행앱에서 착안을 해봤습니다

강점 / 약점 분석

당연하지만, 위 두가지를 개선(?) 한다고 해서 당장 효과를 볼 것이라고 생각하지 않았습니다.
롤 모델을 정해 분석해보기로 했고, 당연히 가장 활성화된 마거카를 대상으로 하였습니다.



0. 인증된 사용자(강점)
네이버 카페는 가입절차가 복잡하지 않아 자유롭게 가입할 수 있습니다. 하지만, 해당 캐릭터가 실존하는지, 아이디를 돌려가며 장난을 치는지 알 수 없습니다.
싴갤러스는 특수한 경우(프록시 등)를 제외하면 부계정 사용시 특별조등 기능 사용에 지장이 오기때문에, 인증된 사용자만이 서비스를 이용하고 있다고 할 수 있습니다. 가입의 편의성보단 아무래도 이쪽에 무게가 실릴것 같았습니다.

1. 연락망(약점)

네이버 카페에는 댓글 및 쪽지가 존재하며 타 기기를 이용하는데 제약이 없어 PC에 한정되지 않아 수월하게 대상과 거래를 진행할 수 있습니다.
하지만, 싴갤러스는 인게임 캐릭터에게 쪽지를 보내는 기능이 존재하나 일방적인 기능이어서, 수월한 대화를 진행하기는 어렵습니다.
따라서, 기능에 대한 보완을 하기 위해 신규개발이 필요하다 생각했습니다.

- 사이트 자체 쪽지 기능 개발
- 어플리케이션을 이용한 Push(쪽지 연동)

2. 레이아웃(약점)

네이버 카페는 기본적으로 게시판입니다. 싴갤러스 가판대는 하나의 아이템을 하나의 글로 등록하는 방식을 취할것이기때문에 많은 데이터가 올라올 수 있고, 오히려 가독성을 저하시키는 효과를 가져올 수 있습니다. 아울러 모바일 레이아웃까지 동시에 생각해야했기 때문에 많은 고민이 있었습니다.

3. 기능(강점)

네이버 카페는 위지윅에디터를 이용한 자유로운 글 편집이 가능합니다.

하지만 그외 실제 게임에 도움이 되는 기능은 존재하지 않습니다.
예를 들면, 지정염색앰플을 판매한다 가정하면, 지염 색상을 싴갤러스에서 검색 후, 스크린샷을 찍어 올려 거래하고 있음을 확인했습니다.
계속해서 말하자면, 유저는 결국 '용지염 다수' 라는 글 제목으로 글을 쓸 수밖에 없고, 구매자는 클릭 후 자신이 원하는 색상을 찾은 후에 없으면 성과없이 뒤로 돌아가는 불필요한 과정이 존재합니다.

따라서, 보는 유저나 쓰는 유저 둘다 편하며, 정확한 아이템 이름 및 표기해줄 수 있도록 하는것을 강점으로 하면 될 것 같았습니다.
그래서, 다음 개발이 필요시 되었습니다.

- 유저 오타 교정(데이터 분석을 기반)
- 아이템 이미지 삽입 기능
- 다수의 아이템을 편하고 빠르게 등록
- 아이템별 카테고리화 (카테고리별 검색 및 목록 필터)

강점 및 약점 분석을 다 마친것 같으니 개발하면서 디테일을 설정하기로 했습니다.

개발진행

연락망

레이아웃을 만들때 했던 고민을 또 해야 했습니다.
추가 개발이지만, 결국 독립적으로 사용될 수 있는 기능을 만드는것이기때문에 필요한 사항을 정리해봤습니다.

- 발신함 / 수신함
- 쪽지 발송
- 삭제/신고/차단/보관
- 전달(?)

쪽지란것은 그냥 핑-퐁만 하면 되어서 구현에 어려움을 겪진않았습니다.
다만 악성유저에 대한 처리를 할 수 있도록 고려해야했습니다. 하지만 가판대를 위한 개발이었으므로, 우선사항에서 미뤘습니다.
왜냐면 단순히 차단이나 신고로 끝나는게 아니라, 관리자가 신고를 접수해 처리할 수 있는 기능을 추가로 개발해야되기때문입니다.
그 결과 다음과 같이 개발했습니다.


실제 사용자가 접속중일때 신규 쪽지가 왔다고 알려줘야되므로, 다음과 같이 3단계에 거친 작업이 필요했습니다.
웹서버 - 세션 - 푸시서버
세션을 따로 관리하고 있기때문에 세션을 얻고, 개인푸시를 진행하게 함으로서 웹소켓을 이용한 푸시를 구현하였습니다.
(추가로, 브라우저를 이용한 web push도 지원할 계획입니다. https에서만 가능해서 현재는 진행을 하지 못하고 있지만 ;D)

여기까지만 만들어놓고 즉시 앱 프로젝트를 진행했습니다.

앱 프로젝트는 Sparrow(참새) - 지저귀다 뭐 이런의미로 시작했습니다. (처음엔 그냥 직박구리로 하자고 했다가..)
개발은 iOS부터 했고, 이후에 Android를 개발했습니다. (9월 11일 출시했습니다)

이 과정은 YOKO.SO 프로젝트를 담당하셨던 라제폰님께서 전담해주셨습니다.
(다운로드는 플레이스토어나, 앱스토어에서 '싴갤러스'를 검색해 받으실 수 있습니다)



앱은 정말 쉬울 줄 알았습니다만 그렇게 생각하다가 큰 코다쳤습니다. 간단한 웹뷰앱이었는데도 공수가 많이 들었습니다.
대표적으로, 앱에서 로그인을 매번하게 할 수는 없었습니다. 저 같아도 그럼 안쓸거같아요.

싴갤러스에서는 따로 자동로그인을 지원하지 않았는데 앱을 위해서라도 로그인을 유지하는 기능이 필요하다고 생각하게 되었습니다.
자동로그인 기능은 결국 클라이언트에 정보를 남기는것이기때문에 보안상 문제가 생길 수 밖에 없고, 최대한 '덜 취약한' 형태로 구현하는것이 목적이었습니다.

실제 plaintext를 알고있다고해도, 어떤 방법으로 토큰이 생성되는지,
무작위 대입공격으로 유추할 수 없을정도로 긴 길이의 토큰을 생성해야하는 생각을 하면서 작업했습니다.
그리고 만약의 경우, 토큰을 복호화할 수 있는지 없는지에 대한 방법도 고민해보고.. 최대한 secure하게 작업하고 싶었습니다.
(물론 해쉬기때문에 쓸데없는 고민입니다)

몇차례 시행착오를 거쳐 자동로그인을 도입했습니다.



이 후, 앱을 위한 사이트 전체 CSS 수정이 있었고(대부분 모바일), 여전히 진행중입니다.
또한 푸시를 위한 디자인도 해야했는데 어떻게 하다보니 된것 같습니다 (대책 없는 설명이지만 정말 어쩌다보니 푸시를 순조롭게 넘은것 같습니다. 오픈소스의 위력을 다시한번 느끼기도 했습니다.)

어떻게 뚝딱 해치운 것 같지만, 아직 넘어야할 산이 두개나 남아 있죠.
바로 본기능인 가판대가 남았습니다. 가판대는 아직 시작도 안했기때문에, 작업 후 후기(?)로 찾아뵙겠습니다.



싴갤러스 - 하나의 기능 리뉴얼을 준비하며 (2)로 이어집니다
2016/09/14 19:21 2016/09/14 19:21

시작하며


제발 마지막 글이 되었으면 좋겠지만..

두번에 걸쳐 HSL과 delta E (CIE 2000)에 거친 색 정렬을 시도해보았으나 정렬된 결과가 아무래도 맘에 들지 않았다.
도대체 21세기에! 색을 정렬하는 방법이 없나?라는 의문을 가지고 구글링했으나.
맞다. 색을 정렬하는 방법은 없다.... 이상한 영상이 하나 있긴한데 색상을 기준으로 하는건 아닌것 같다.

이 글을 쓰게 된데는 이유가 있다. 바로 이 글을 봤기 때문이다.

Unfortunately this idea runs into a basic problem: You can’t sort colors. Because the human eye has three distinct color sensors (red, green, and blue), color is fundamentally a three-dimensional quantity, and there is no linear ordering that brings together “similar” colors. If you sort first by amount of red, for example, then you may bring together wildly different hues and brightnesses. If you sort by hue, then you bring together wildly different degrees of saturation and brightness, and so on. There’s just no way to do it.

댓글에 애초에 베이스부터가 틀렸다고 색 정렬 못한다고 하는데 이대로 끝낼 순 없지않은가?
이가 없으면 잇몸으로라도 한다고... 정렬하는 척이라도 해야지 않을까?

그래서

처음에 접근한 방법은 휘도, 채도를 이용해 HSL로 색을 정렬하는 방법이었다.
공식에 사용되는 수치는 조금씩 다를 수 있지만 원리 자체는 별차이가 없다.

이 방법은 SQL 쿼리만으로도 뽑아낼 수 있다. (아주 편함)
order by SQRT(`R` * `R` * 0.241 + `G` * `G` * 0.691 + `B` * `B` * 0.068)


다음과 같은 SET을 얻을 수 있었다. 온전히 색의 밝기만으로 정렬하는것이기때문에
색상들이 진행될수록 어두워지는걸 알 수 있다. 하지만 정렬이라고 보긴 어렵다.



그 다음으로 시도한것이 delta E (CIE 2000) 으로 색상사이의 간격을 계산 후 정렬하는것이었다. (color distance or difference)
사실 여러방법으로 시도하는 글이 있고, 여러 알고리즘이 있지만, 결국 원리는 비슷했기때문에 요방법만 해보기로 했다.

HSL 로 정렬한 SET에서 색을 한개씩 뽑아내 그 색으로부터 가장 가까운 색을 뽑는것이다.
이 방법은 꽤 괜찮은 시도였다고 생각한다.



꽤 군집이 생긴것 같지만, 여전히 '완전한' 정렬이 되었다고 보긴 어려웠다. 갑자기 회색톤으로 가다가 빨간색이 나오질 않나..
그래서 정렬하는 과정을 꼼꼼히 살펴보기로 했다. 예를 들변 핫핑크에서 꽃핑크를 선택하는 과정은 다음과 같았다. 길어서 중간은 좀 잘랐다.

[!]블드핫핑크
[INIT] 레몬(금속) 155.26638858087
[CHANGED] 리옐(금속) 152.03349927037 
[CHANGED] 리옐 151.11097423585 
[CHANGED] 핫핑크 10.281657185973 
[CHANGED] 꽃핑크 7.5335844516123 
[ADDED] 꽃핑크

[!]꽃핑크
[INIT] 레몬(금속) 150.23029944029
[CHANGED] 리옐(금속) 147.51696619098 
[CHANGED] 리옐 146.71284135744 
[CHANGED] 딥핑크 13.359231425896 
[CHANGED] 딥핑크(금속) 13.359231425896 
[ADDED] 딥핑크(금속)


색상거리의 최소값을 계산하는 과정인데 하자가 없어야했다. 이론대로라면 완전히, 깔끔하게 정렬되어야 하는데 왜 저런 결과가 나온걸까?
도대체 중간에서 오른쪽쯤에 떨어진 저 빨간색은 왜 거슬리게 저기 있어야만 한걸까?

저 친구의 이름은 블드체리인데, 저 친구도 물론 후보로 거론된적이 잇는 친구였다. 하지만..

[!]체리분홍(금속)
 [CHANGED] 블드체리 16.814328547159 
[CHANGED] 블드탁한체리분홍 6.9852497800933 
[ADDED] 블드탁한체리분홍

[!]블드탁한체리분홍
[CHANGED] 블드체리 15.356974641448 
[CHANGED] 블드체리분홍 10.401343164254 

[CHANGED] 블드체리 22.072876833766 
[CHANGED] 블드핫핑크 5.735796527615 
[ADDED] 블드핫핑크

[CHANGED] 블드체리 18.265066068665 
[CHANGED] 핫핑크 17.31315523967 
[CHANGED] 딥핑크 13.359231425896 
[CHANGED] 딥핑크(금속) 13.359231425896 
[ADDED] 딥핑크(금속)

[CHANGED] 블드베이비핑크 48.921819262293 
[CHANGED] 블드체리 40.790667505018 
[ADDED] 블드체리


밀리고 밀리고 밀리다가 색상차이가 40이나 되는 상관없는 색에게 선택받을 수 있었던것이다.
코드상으로는 최소한의 색상차이가 나는 색상을 뽑았기때문에 문제가 없지만, 이는 정렬이 되었다고 판단할 수 없게 만드는 가장 큰 요소였다.
근소한 값으로 차이가 발생했다고 하더라도 선택되지 않으면 다음 색상 선택에서 완전히 달라진 결과를 도출하기 때문이다.

그래서 오차를 줘서 후보군을 구제해보기로 했다.
블드체리 색상은 11정도의 색상차이로 탈락하기 때문에 얼마나 큰 차이가 있을지 비교해보기위해 시각화해서 비교해보기로 했다. (인간의 눈 기준으로)
다음은 그 결과이다.



뭘 보라고 하는지 모르겠는 사람도 있을 것 같지만, 3번라인을 보면 튀는 값도 없고 정렬됐다고 할 수 있을지도 모른다. 흠..
그렇다면 최종 선발된 값과 탈락한 후보군들과의 색상차를 모두 다시 계산해 준다면 어떨까?

요컨데 이런식이다.

[!]탁메론
...
[CHANGED] 연두 11.174564290748 
[CHANGED] 블드연두 8.8682969251542 
[ADDED] 블드연두
...
[CHOSEN]블드연두 ->블드연한메론 18.812444073324
[CHOSEN]블드연두 ->연두 3.1295681624566
[ADDED2] 연두


과정을 되새김질해서 아깝게 탈락한 후보군들을 재활용해보겠다는것이다.
위와 같이 연두컬러는 블드연두라는 컬러와 겨우 3차이의 색상차가 발생해 탈락하지만, 재검사로 바로 다음에 색상을 배치하는것.
그 결과는...


여전히 카오스지만 꽤나 스무스해졌다(고 생각한다)
이 중에서 제일 괜찮아 보이는 4번라인으로 최종선택을 했다.

결론





결과적으로만 놓고보면... 거의 차이가 없다 ㅠㅠ.. 그치만 블드체리 친구(빨간줄)이 사라졌다....... 이게 소득일까...?

사람이 판단 하는 색상과 기계가 판단하는 색상을 동일하게 볼 수 없다는것이며, 휴먼소팅(...)을 해야 예쁜 그라데이션을 만들 수 있을 것 같다.

이 삽질의 흔적은 싴갤러스 지염 도서관에서 찾아보실 수 있습니다...





2016/05/22 00:43 2016/05/22 00:43
이 글은 HSV(HSL) for DB query - Sort color by lightness 에서 이어진 글입니다.

HSL은 밝기 기준으로 색을 정렬하는 기준이다.
하지만, 무작위 배열을 선택해 정렬했을 때는 전혀 정렬한것 같게 보이지 않는다는 단점이 존재한다.
복습해보자면, 간단한 쿼리로 HSL을 계산해서 색을 정렬했었고 그 결과는 다음 이미지와 같다.



사실 표본이 작기 때문에 이정도로도 충분히 정렬되었다고 판단할 수 있다.
하지만 모든 표본을 나열해보면 그렇지가 않다.
다소 길지만 비교를 위해서 그냥 올려본다. 양해를 구한다.



모든 표본을 나열했을때 밝음에서 어두움으로 넘어오곤 있지만, 사실 밝기 diff는 몰라도 사람의 시각으로는 이 데이터는 '정렬' 되었다고 말할 수가 없다.
물론, HSL이 쓸모가 없다는것은 아니다. 단지, 무작위 데이터를 처리할때 한가지 더 처리를 해줘야된다는것을 얘기하고 싶은것이다.

color Difference를 구하는 방법은 여러가지가 있으며 위키피디아에서 다수의 방법을 확인할 수도 있으며,
휘도(Luminance)로 정렬하는 방법도 존재한다.

하지만 휘도는 결국 Brightness 로서 HSL과 별 다를바가 없으며, 정렬햇을때도 결과가 비슷했다.
여러 방향으로 접근을 해봤으나 결론은 그라데이션(gradient)를 구현하려면 한가지 처리를 더 해야겠다고 생각했는데 (말은 쉽게하지만 나름 고민 하느라 많은 시간을 보냈다 ㅠㅠ) 그러다가 이 글을 보게 되었다.

내가 얻은 결론은 한가지 색을 뽑고 그 색의 color DIff를 계산해서 근접한 값을 모아줘야된다것이다.

데이터가 200개도 안되는 작은 숫자였기때문에, 선택 정렬(selection sort)을 이용해 정렬을 해볼까 했다.
2단 루프로 o(n^2)로 엄청나게 느리지만 표본이 적고, 먼저 HSL로 정렬된 값을 뽑기때문에 가능할거라 생각했지만..
중복처리를 하려면 답이 안나와서 결국 멋대로 작업해보기로 했다.
루프를 하나 돌고, 어레이를 삭제하고 초기화하는 좀 극단적인 방법이지만 별 다른 수가 떠오르지 않았다.....ㅠㅠ

색 판별은 delta E(CIE 2000) 알고리즘을 사용하기로 했다. color diff를 계산하는 방법은 여러가지가 있었으나, 색사이의 distance를 계산해야했기때문에 이 알고리즘을 선택했다.
라이브러리르는 직접 구현하지 않고, github에서 찾아다 썼다.

$sArray = Array();
$sArray[0] = $array[0];
$count = 0;

$i = 0;
while ( count($array) ) {

    $diff = "";
    $pointer = "";

    for ($j = 0; $j < count($array); $j++ ) {
        $cDiff = (new color_difference())->deltaECIE2000([ $sArray[$i]['colorR'], $sArray[$i]['colorG'], $sArray[$i]['colorB'] ], [ $array[$j]['colorR'], $array[$j]['colorG'], $array[$j]['colorB'] ]);
            if ( $diff == "" ){
                $diff = $cDiff;
                $pointer = $j;
            } else {
            if ( $cDiff < $diff )  {
                $diff = $cDiff;
                $pointer = $j;
            }
        }
    }

    $sArray[] = $array[$pointer];
    if ( $i == 0 ) {
        unset($array[0]);
    }
    unset($array[$pointer]);
    $array = array_filter($array);
    $array = array_values($array);
    $i = count($sArray)-1;

}


그 결과이다.


아래 그림은 최종본은 아니고, 실제로는 정렬되어있다.
재밌는 점은 분명히 이렇게 엮일거같다고 생각한 색들도 알고리즘에 의해 계산된 숫자 수치로는 다르다는점이었다
사람의 시각으로 정렬하는게 맞겠지만.. 일단은, 여기까지!



색상 정렬 (Color sort) 맺으며.. 에서 이어집니다.


Reference
https://en.wikipedia.org/wiki/HSL_and_HSV
https://en.wikipedia.org/wiki/Color_difference
https://github.com/renasboy/php-color-difference
2015/10/20 03:16 2015/10/20 03:16

1 2