본문 바로가기
정보공유

[정보] Redis, MongoDB 그리고 MySQL 과 함께하는 모바일 애플리케이션 서비스에서의 로그 수집과 분석

by 날고싶은커피향 2015. 4. 19.
반응형

날고싶은 커피향



Redis, MongoDB 그리고 MySQL 과 함께하는 모바일 애플리케이션 서비스에서의 로그 수집과 분석 관련된 자료입니다. 

내용 참고 하시기 바랍니다. 




Transcript

1. Redis, MongoDB 그리고 MySQL모바일 애플리케이션 서비스에서의 로그 수집과 분석 박현우 (@lqez) / 스마트스터디

2. lqez

3. NoSQL

4. NoSQL?NoRDB?

5. NoSQL = Not only SQL Do not use SQL via http://nosql-database.org/

6. In-memory Document Store ACIDRedis, MongoDB 그리고 MySQL NoSQL RDBMS

7. In-memory Document Store ACIDRedis, MongoDB 그리고 MySQL Salvatore NoSQL Dwight Monty RDBMS

8. vs

9. 10년 전으로 돌아갑니다.

10. “로그를 보려면 한 달 정도 걸립니다.그래도 어제 동접은 나오잖아요.” “동접이 중요한게 아닙니다. , 언제 이탈하는지 알아야죠.”

11. 1일 최소 5(반복됨)지표요청 로그가 있는가? 스키마 설계! DBA가 반려 1 + 5 = 6

12. 123일테이블 생성 프로토콜 추가/테스트 점검일 대기 서버 재시작 1 + 2 + 3 = 6

13. 최소 51일서버팀에 로그 요청 CSV로 받음 엑셀에 넣음 끝! 5 + 1 = 6

14. 좀 과장되게 얘기해서6 + 6 + 6 = 18

15. IL E D FA엑셀 65,536행 초과

16. 뭐가 문제인지 모르겠어

17. 2년 뒤목마른 사람이 우물을 팝니다

18. WBERSLAMP 기반 웹 서비스스키마 저작 도구 phpMyAdminHTTP / HTTPS로 로그 쌓기클라이언트 덤프 수집 / 분석자주 사용하는 스키마 / 쿼리 저장/ / 버전 단위 테이블 파티셔닝

19. 덤프 수집기 & 분석기 쿼리 작성

20. 11일지표요청 로그가 있는가? 스키마 설계 클라이언트 수정 1 + 1 = 2

21. 1일로그 확인 쿼리 작성 지표 도출 끝! 1

22. 거짓말 조금 보태서2 + 1 = 3

23. 30일 내에 승부via KTH H3 2012 기획/디자인/개발자 모두 알아야 하는 대박앱의 비밀’, http://dev.kthcorp.com/2012/11/02/h3-2012-ebook/

24. LOG필요한 사람이 설계해야 하고,필요한 시점에 수집해야 하고,필요한 시기에 활용해야 한다.

25. 그래도 동접이 떨어져요

26. 괜찮아! 망했어요 흑흑 mysqldump -uroot -p -e --opt -c log | gzip -c log-20121114.sql.gz로그를 잘 쌓으면 망해도 준치 다음 번 서비스 지표로 활용 가능

27. 단점MySQL은 지속적으로 확장하기 어렵다.어쨌든 스키마를 매번 만들어야 한다.쌓는 중엔 형식 변경 비용이 비싸다.

28. 모바일 환경항상 로그 전송이 가능한 상태는 아님.JSON 형태로 로컬 저장소에 보관하다,n개까지 모으거나, 필요한 경우 즉시 발송.서버에서는 받은 후, 낱개로 풀어서 저장.

29. 장애 대응HTTP / HTTPS 로 전송200 OK 응답을 받지 못한 경우 장치에 보관IDC 이전시 효과적으로 활용

30. Speaker’s note기존에 하던 방식과 비슷하지만, 서버의 응답을 확인해 서 200 OK 를 받지 않으면 로컬 큐에서 해당 로그를 제 거하지 않고, 다음에 다시 보낼 수 있도록 합니다.이를 이용해, 올해 IDC를 이전하면서 약 5-6시간 정도의 장애가 있었는데 해당 기간의 로그를 잃어버리지 않고, 대부분 회수할 수 있었습니다.물론, 네트워크가 활성화되지 않은 상태에서 한 번 켜고, 다시 켜지 않으면 해당 로그는 잃어버리지만, 감당할 수 있는 범위의 loss라고 판단했습니다.

31. 로그 스토리지 검토자원 = 개발자 + 시간 + 자원이 부족했기에 제한된 선택만 가능대용량 처리 능력보다 사용 편의성에 중점Hadoop, Cassandra 등은 개발 역량과다 운용비용 부족

32. 해결기존 : MySQL은 지속적으로 확장하기 어렵다. ReplicaSet, Sharding을 지원한다.기존 : 어쨌든 스키마를 매번 만들어야 한다. JSON 형식으로 자유롭게 저장 가능.기존 : 쌓는 중엔 형식 변경 비용이 비싸다. 원한다면 언제든지 내용을 바꿀 수 있다.

33. Server Server ServerApache httpd Apache httpd Apache httpd mod_php mod_php mod_php

34. Server Server ServerApache httpd Apache httpd Apache httpd mod_php IL E D mod_php mod_php FA 900+ connections

35. Speaker’s note접속자가 늘어나 900 커넥션이 넘어가자 더 이상 동작 할 수 없는 상황에 이르게 됩니다.락 작업과 쓰기에 바빠 더 이상의 접속을 허용하는 것이 무의미해집니다.MongoDB는 시스템 ulimit80%가 기본 커넥션 제한 값이고, 최대 2만개의 연결을 허용하지만, 천개쯤만 되어 도 장애 상태가 되었습니다.

36. Server Server ServerApache httpd Apache httpd Apache httpd mod_php mod_php mod_php 900+ connections

37. Server Server Server Apache httpd Apache httpd mpm_prefork 사용 httpd Apache httpd Apache 프로세스마다 커넥션을 요구 mod_php mod_php mod_php 연결 폭주, 서비스 장애 발생 MongoDB Global write lock 문제 900+ connections 위 상황은 MongoDB 1.6.3 을 가정함

38. Server Server ServerApache httpd Apache httpd Apache httpd mod_php mod_php mod_php Predis Predis Predis Redis Redis Redis

39. Speaker’s note매 사용자 연결 마다 커넥션을 맺는 것이 불합리하므로, 한 곳에 모아 일괄적으로 넣으면 어떨까 생각이 들어 redis를 도입했습니다.MySQL 같은 경우에도 여러 트랜잭션으로 insert 하는 것에 비해 한 트랜잭션에 몰아 넣는 것이 효율적이므로, 같은 방식으로 적용해봤습니다.이에 phpPredis 모듈을 활용하게 되었습니다.

40. Server Server ServerApache httpd Apache httpd Apache httpd mod_php mod_php mod_php Predis Predis Predis Redis Redis Redis

41. Server Server Server RedisApache httpd mod_php Apache httpd mod_php Apache httpd mod_phpPredis In-memory Key-Value Storage by Predis C Predis ANSIReplication, Cluster 지원다양한 데이터 타입 지원 Redis Redis Redis strings, hashes, lists, sets, sorted sets

42. Link@charsyam blog (very useful) http://charsyam.wordpress.com/category/cloud/redis/Redis를 이용한 MongoDB 기반 로그 수집기 성능 개선 http://blog.naver.com/ez_/140158788246Predis, using redis on PHP http://blog.naver.com/ez_/140158670703

43. Server Server ServerApache httpd Apache httpd Apache httpd mod_php mod_php mod_phpRedis를 일종의 버퍼로 사용Predis bulkInsertPredis 모아서 가능 Predis로그 수 파악을 위한 캐시 UPDATE 명령 절약피크시 200 log/sec 에서 ~3MB의 메모리 사용 Redis Redis Redis

44. Speaker’s notepercona에서 제공하는 모니터링 플러그인을 사용해서 모니터링합니다. http://www.percona.com/software/percona-monitoring-pluginscacti로 관찰한 것 뿐 아니라, mongostat 이나 mongod 의 웹 페이지를 통해 mongo의 상태를 보는 것도 좋습니 다.서비스/이벤트, 즉 로그의 종류에 따라 몇 개나 쌓았는지 를 기록하는데, 이를 로그를 쌓으면서 같이 업데이트 합 니다. 이 쿼리 또한 벌크로 넣으면서 절약할 수 있었습니 다.

45. Server Server ServerMongoDB 버전에 따라 write lock 개선Apache httpd Apache httpd Apache httpd mod_php mod_php mod_php Version Level Description Predis 1.6 Predis Global Predis 2.0 Global locking-with-yield 2.2 Database Redis Future Redis Collection Redis

46. Speaker’s note1.6 시절과 달리 MongoDB 는 많은 발전을 이뤄, redis / memcached 등의 레이어를 두고 쓰던 사용자들 중 일부 는 2.0으로 업그레이드 하며 캐시 레이어를 제거했다는 글을 쓰기도 했습니다.locking-with-yield 기능을 통해 page fault 상황에서 쓰 기 성능이 극적으로 개선된 벤치마크를 살펴볼 수 있습 니다.앞으로는 전역 lock, 데이터베이스 단위 lock을 넘어 콜 렉션, 즉 테이블 수준의 락을 지원한다고 합니다. 언젠가 는 RDB 수준의 object 단위 락도 기대할 수 있지 않을 까 보고 있습니다.

47. LinkRemoving Memcached because it’s too slow http://blog.serverdensity.com/removing-memcached-because-its-too-slow/ 번역 : http://charsyam.wordpress.com/2012/06/08/Goodbye global lock MongoDB 2.0 vs 2.2 http://blog.serverdensity.com/goodbye-global-lock-mongodb-2-0-vs-2-2/ 번역 : http://charsyam.wordpress.com/2012/05/24

48. Server Server ServerApache httpd Apache httpd Apache httpd mod_php mod_php mod_php Predis Predis Predis Redis

49. Speaker’s note여러 대의 Redis 를 써야할 정도로 Redis에 부하를 주지 않아, 1대의 Redis로 옮겼고, 그 배경에는 서로 다른 Redis 에 데이터를 부어 넣음에 따른 로그의 순서 문제 도 있었습니다.Redis에 들어가 있는 순서대로 MongoDB에 들어가게 되는데, 1분 단위로 서로 다른 타이밍에 MongoDB에 부 어 넣으면서, 순차적이지 않은 문제가 있어 변경하게 되 었습니다.

50. Master Replication DiagramSlave Analytics Active / Standby Map / Reduce ~10,000,000 logs/

51. Master Replication DiagramSlave IL E D Analytics Active / Standby FA Map / Reduce ~10,000,000 logs/

52. MongoDB Master Redis를 버퍼로 사용 Replication Diagram서비스는 ReplicaSet UPDATE 명령실로그 수 파악을 위한 캐시추천 Analytics절약 Slave150 log/sec 에서 2TB x 6 RAID 10사용 사용16GB RAM, SATA ~3MB의 메모리 장비MongoDB 점검이나 이관시에 매우 유용현재 약 13억 건, 1TB의 데이터를 축적도저히 장비 1대로 Map / Reduce 할 수가 없음Sharding 등을 포기하고 다른 방법을 시도

53. Active / Standby Map / Reduce

54. Active / Standby Map / ReduceMySQL /MyISAMSQL에 친숙하다운용 경험이 있다계속 쌓기만 하면 빠른 편

55. Active / Standby Map / Reduce Master Slave Slave16GB RAM, SATA 2TB x 4 RAID 10 장비 사용

56. Speaker’s noteMongoDB와 마찬가지로 3대의 MySQL 을 구동하고 있 으며,2+1대를 운용하는 것은, 한 대의 장비에 장애가 생겼을 경우, 2대로 구성된 M/S 구조라면 HA가 바로 깨어지는 문제가 있을 뿐 아니라, 성능 개선이나 확장을 위해 Slave 장비를 교체하는 경우에도 마찬가지입니다.현재 하나의 Slave는 통계 전용으로 쓰고, 하나는 서비스 에서 읽기 전용 데이터를 읽는데 사용해 낭비를 최소화 하고 있습니다.

57. SQL to MongoDBhttp://www.mongodb.org/display/DOCS/SQL+to+Mongo+Mapping+Chart

58. SQL to MongoDBSQLSELECT * FROM usersMongoDB O O Ldb.users.find() C

59. SQL to MongoDBSQLSELECT DISTINCT last_name FROM usersMongoDB Edb.users.distinct(last_name) FAKSpeaker’s note : distinct 10,000개 이상을 처리할 수 없습니다.

60. SQL to MongoDBSQLSELECT team, SUM(score) AS total, COUNT(*) FROM scoreboard GROUP BY team ORDER BY total DESC

61. SQL to MongoDBMongoDBdb.scoreboard.group({ key: { team: true }, initial: { total: 0, count:0 }, reduce: function(obj, prev) { prev.total += obj.score; prev.count += 1; G O D Y }}) M H NO SO O RT

62. SQL to MongoDBSQLSELECT msg FROM feed WHERE user_id IN ( SELECT id_to FROM friend WHERE id_from = x ) ORDER BY written_dt DESC LIMIT 10

63. SQL to MongoDBMongoDBdb.feed.find( { user_id: { $in: db.friend.group( { cond: { id_from: x }, initial: O { friends: [] }, RE RDC reduce: function(obj, prev) { } H A prev.friends.push(obj.id_to); } )[‘friends’] }, { msg:1, _id:0 } ) .sort( { written_dt: -1 } ) .limit( 10 );

64. Active / Standby Map / Reduce PV / UV DAU / MAU PU / ARPU NRU / RR

65. MongoDB to MySQL1분 단위로 전송 _id 값을 이용해 중복 피함StringInteger로 변환 > GROUP 용이익숙한 SQL을 통해 원하는 데이터 추출추출된 데이터를 다시 MySQL에 저장

66. Speaker’s note로그를 생성한 시점의 디바이스 시간이 JSON에 포함되 어 있고, Redis가 받은 시간과 MongoDB로 넣은 시간까 지 기록하므로, 여러 로그를 한 번에 수집하고, 1분 단위 로 벌크 인서트를 수행하더라도, 로그들 사이의 상대적 인 시간 관계를 확인할 수 있습니다.개인 식별자, 기기 종류, ID, 이벤트 ID, 시간, 타임존, 언어 설정 등을 수집합니다.String에서 Integer로 변환하기 위한 Lookup 테이블을 생성하고, 이를 지속적으로 업데이트 합니다.

67. Visualization쌓여 있는 데이터를 읽어 JSON 생성JSONGoogle Chart API에 던짐Twitter Bootstrap 사용

68. ?과연 잘 하고 있는 걸까?

69. 바퀴의 재발명Fluentd Treasure Data Ruby LightweightFlume Apache Java Simple, Cloudera supportChukwa Apache Hadoop Java Hadoop based, Rich metadataScribe Facebook C++ Complex, but fast

70. 바퀴의 재발명Fluentd http://uentd.org/Flume http://ume.apache.org/Chukwa http://incubator.apache.org/chukwa/Scribe https://github.com/facebook/scribe

71. 바퀴의 재발명

72. 바퀴의 재발명 baas.io http://baas.io/Google Analytics http://google.com/analytics Flurry http://www.urry.com/

73. Speaker’s note이미 다양한 로그 수집 애플리케이션이 존재하므로, 알 아보지 않고 새로운 것을 만드는 것은 낭비입니다.수집하고자 하는 내용과 분량에 따라 적합한 솔루션을 선택해 기회 비용을 낭비하지 않을 수 있습니다.로그 수집뿐 아니라 분석과 통계까지 제공하는 다양한 솔루션을 활용할 수도 있습니다.

74. Conclusion달라진 환경에 대응하는 수집 전략꼭 한가지 기술만 쓸 필요 없음이미 알고 있던 기술을 최대한 활용역할에 맞는 일을 맡겨, 장점을 최대화

75. 감사합니다 박현우 (@lqez) / 스마트스터디


반응형