STEEM의 "reputation"을 형성하는 11가지 요인 분석

in #kr5 years ago (edited)

분석 목표


혹시 STEEM내 "reputation(=명성 혹은 평판, 이하 reputation)"을 결정짓는 중요 요인들에 대해 궁금하셨던 적이 있으신가요?

이 글에서는 "reputation"의 상승과 관련 있을 것으로 보이는 11개 요인과의 상관관계를 심층 분석합니다.


제한 조건


2월 20일 기준으로, reputation이 61이상인 5,779개 계정에 한해, reputation의 상승과 연관있을 것으로 보이는 11개 요인별 값을 산출한 뒤, 각 요인별 상관관계를 분석했습니다.

STEEM의 "reputation"은 상용로그함수를 응용하여, "reputation"이 9단계 오를때마다 실제로 얻은"reputation score"는 무려 10배 상승하는 구조로 설계되어 있습니다. 이에 의하면, reputation 34가 reputation 61이 되려면, 무려 1,000배의 reputation score를 쌓아야 합니다. 따라서 주요요인별로 유의미한 상관관계분석을 하기 위한 기준점으로 reputation 61이상 조건을 설정한 것은 꽤 합리적이라고 생각합니다.

최근 글에서 "reputation"의 계산원리 및 주요 특성을 대다수 일반 유저들의 관점에서 직관적이고 쉽게 다룬 적이 있습니다. 이에 대해 전혀 모르시는 분은 그 글을 볼 필요는 있지만, 필수적이거나 선결과제는 아닙니다.

스팀 내 "명성"에 대한 직관적 이해를 돕는 3가지 룰


Ⅰ. reputation과 11개 요인 간 상관관계 요약


7000.png

위 표는 reputation_score, reputaion과 그에 영향을 미칠 것으로 보이는 11개 요인 간 상관관계를 보여줍니다. 사실상 이 글의 핵심내용이자 어쩌면 거의 모든 것입니다.

"reputation"은 실제로 "reputation_score"에 의해 산출되기 때문에, "reputation_score"를 근거로 가장 정확하게 비교할 수 있습니다. 하지만 실제로 "vesting_payout"요인에 대해서만 "reputation_score"가 "reputation"대비 더 높은 상관관계를 나타낼 뿐(86% vs 66%), 다른 수치는 거의 유사하게 나타났습니다.

따라서 이후에는, 편의상 위 표의 우측에 기재된 "reputation"과의 상관관계값을 가지고 분석하겠습니다.

7002.png

위 차트는 reputation과 11개 요인 간 상관관계를 그 강한 정도 순서로 나열한 것입니다.

"vesting_payout of posts"과의 상관관계가 66%로 가장 높았고, "payout of posts"도 53%로 충분히 높게 나타났습니다. 두 요인은 reputation산출의 바탕이 되는 변수들이므로 어쩌면 당연한 결과입니다.

다소 놀라운 점은, reputation이 "followers' SP SUM"과도 양의 상관관계가 54%나 된다는 것이었습니다. "followers"와도 53%였습니다. 이는 "payout of posts"가 53%였음을 감안시, 상당한 숫자로 보입니다.

이 외에는 "posts"(포스트수)가 28%, "created day"(가입일)이 25%정도로 유의미한 상관관계가 있었습니다. 아무래도 "posts"가 많을수록, "created day"가 오래지났을수록 reputation이 상승할 개연성이 있는 것이 당연하지만, 그 상관관계가 아주 높다고만 볼 수는 없는 수준입니다.

그리고 의외로 "effective SP"(유효SP), "owned SP"(소유SP), "reward per post"(포스트당 평균 리워드)와 reputation간에는 10%초반의 낮은 상관관계만 있을 뿐이었습니다.

정말 의외였던 것은, reputation과 "comments"(코멘트수:포스트수+댓글수)와의 상관관계가 8%로 사실상 무관하다고 볼 수도 있는 정도라는 것이었습니다. "replies"와의 상관관계는 7%로 오히려 더 낮았습니다.

"posts"와의 상관관계가 28%정도로 유의미했음을 감안하면, "replies"를 무의미하게 늘리는 행위로는 61이상의 reputation을 얻는데 있어 큰 도움이 되지 않는 것으로 나타난 것입니다. 다만, 가입 후 초기에는 "replies"도 약간의 역할을 할 것으로 생각됩니다.


Ⅱ. reputation과 11개 요인 간 상관관계 상세


기본적인 요약은 이미 끝이 났습니다.

대표적인 8개 요인에 대해 그 분포도 및 reputation구간별 평균값을 상세하게 보겠습니다.

① vesting_payout of posts

7005.png

vesting_payout of posts 요인과 reputation의 상관관계는 66%로 매우 높습니다. 분포도 상으로도 매우 뚜렷하게 나타납니다.

② payout of posts

7006.png

"payout of posts"요인과 reputation의 상관관계도 53%로 꽤 높습니다. 분포도 상으로도 선명한 편입니다.

③ followers' SP SUM

7007.png

followers' SP SUM 요인과 reputation의 상관관계도 54%로 꽤 높습니다.

④ followers

7008.png

"followers"요인도 53%로 꽤 높습니다. 결국 "followers' SP SUM", "followers" 요인은 "payout"요인만큼이나 reputation과 상관관계가 높다는 점에 주목할 필요가 있습니다.

⑤ posts

7009.png

"posts"요인과 reputation의 상관관계는 28%로 유의미한 수준입니다.

꾸준한 post가 결국 reputation을 높이는데 기여함을 알 수 있습니다.

"강한 자가 살아남는게 아니라, 살아남는자가 강한 것이다"라는 격언을 실감케 하네요.

⑥ created day

7011.png

"created day"요인도 25%의 의미있는 상관관계를 보였습니다.

STEEM활동을 그만두지 않고, 꾸준한 post를 작성했다면, 결국 reputation이 높아지게 된다는 의미입니다.

⑦ comments

7010.png

"comments"요인과 reputation과 거의 상관관계가 없습니다. 단지 8%입니다.

많은 사람들이 착각할 수 있는 부분으로 보입니다.

가입 초기 reputation이 낮을 때는 많은 "comments"가 도움이 될 수도 있겠지만, reputation이 61이상인 경우를 기준으로 보면, "comments"요인은 아무런 관련이 없었습니다.

"comments"요인 대신 "replies"요인만으로 봐도 7%로 매우 낮았습니다.

결국 reputation상승에 있어 그나마 연관 있는 것은 "posts"요인이고, "comments"혹은 "replies"가 아니라는 것입니다.

"replies"를 많이 다는 것과는 별개로, 품질 좋은 post가 우선임을 알 수 있습니다.

⑧ effective SP

7012.png

"effective SP"요인과 reputation의 상관관계는 14%의 약한 상관관계만 있었습니다.

"comments"요인과 마찬가지로, 오해가 많은 요인일 것입니다.

참고로, "owned SP"요인은 12%, "reward per post"요인은 13%였습니다.

reputation이 61이상인 경우에서는, reputation이 높다고 "effective SP", "owned SP"가 높다고 단정하기 어렵습니다. 물론, 현재 STEEM활동을 그만 둔 계정들로 인해 상관관계가 실제보다 낮게 추정되었을 개연성이 다소 있습니다. 또한 SP가 높다면 아무래도 셀프보팅만으로도 어느정도 reputation을 올릴 수 있습니다. 다만 상관관계가 약한 것으로 보아 과도하게 셀프보팅을 하는 계정의 비중이 아주 높지는 않은 것으로 보여집니다.

아래는 11개 주요 요인의 reputation구간별 평균값입니다. (참고목적)

7004.png


Ⅲ. reputation의 한계


① 현재 reputation은 반쪽짜리 지표화: 대표성 부족

6500.png

위 이미지는 댄 라리머가 과거 STEEM의 "reputation"에 대해 설명할 때 올렸던 것입니다. 다만, 제가 문장 중간에 "NOT"을 추가했습니다.

처음 댄 라리머가 STEEM을 만들때만 해도, 그의 머릿 속에서 STEEM에서 "reputation"은 모든 것이었을 수 있습니다. 현재 STEEM에서 "reputation"은 당연히 전부가 아닙니다.

"reputation"과 무관하게, 여러 목적으로 사용되는, 다양한 부계정들이 많습니다.(투자, 게임 등)

7113.png

위 표의 좌측은 "followers' SP SUM"기준 상위 20계정이고, 우측은 "reputation"기준 상위 20계정입니다.

좌측에는 ned, dan 및 주요 증인들이 들어있습니다. 반면 우측에는 haejin, chbartist가 최상위에 포진하고 있습니다. 어느 쪽이 좀 더 신뢰성있는 순위로 보이십니까?

그래도 글을 작성하는 계정에 대해서는 "reputation"지표가 실질적인 영향력을 나타낼 수 있어야 합니다. 기본적으로 STEEM의 모토는 콘텐츠의 가치에 따라 리워드풀이라는 일종의 우물물을 분배하는 시스템이기 때문입니다.

하지만, 여러 형태의 bidbot등장으로 인해, 우리는 얼마든지 쉽게 reputation score를 쌓을 수 있습니다. 이것은 사용자 단위가 아니라, STEEM의 시스템 단위에서의 문제점으로 보입니다.

과거 조사를 통해 전체 리워드풀에서 bidbot이 가져가는 비중이 상당함을 알 수 있었습니다.

"Proof-of-Brain이냐, Power-of-Bid(bot)이냐, 그것이 문제로다."

② 보완지표의 필요성 증대

이로 인해 대안적인 지표들을 추가할 필요가 있습니다.

먼저 가장 훌륭한 병행지표는 "followers' SP SUM"입니다.

reputation과의 상관관계가 "payout"요인과 대등한 것으로 조사되었고, 실제로 reputation세그먼트별 평균값 대비 "followers' SP SUM" 값이 저조하거나 높은 계정들이 많습니다.

어떤 계정의 reputation이 높고, 높은 "followers' SP SUM"값도 가지고 있다면 실제 영향력도 대체로 높다고 할 수 있을 것입니다.

물론, "followers' SP SUM"값이 높더라도, 사람들이 그 계정을 좋아하는지 알기가 어렵다는 단점은 있습니다. 사람들은 몇몇 비호감 계정에 대해서도 관찰/감시 목적으로 팔로우하기도 합니다.

따라서, 생태계를 교란하는 일부 계정의 " followers' SP SUM"값도 꽤 높을 수 있습니다. 다만, 이 단점은 장점 대비 미미한 수준으로 보입니다.

"followers"요인도 reputation과 높은 상관관계가 있었지만, 팔로워수는 가입시기에 따라 천차만별일 수 있습니다. 붐이 일어났을 때 이미 오래 활동하고 있었다면, 비슷한 reputation을 가진 다른 계정보다, 상대적으로 팔로워숫자가 매우 클 수도 있습니다.

따라서 "followers" 대신 "followers' SP SUM"을, "comments" 대신 "posts"를 reputation과 함께 표시해 주는 것이 좀 더 계정의 실질적 영향력을 확인하기에 좋을 것으로 생각합니다. 물론, comments를 표시한 것은 post와 reply를 동등하게 보고 의견 교류의 장을 만들겠다는 좋은 의도였을 것 같습니다. 하지만 실제적으로 reputation과 comments는 무관했습니다.

이는 계정의 실질적인 평판/인지도/영향력을 볼 수 있게 해줌과 동시에, 부수적으로는 좀 더 타인을 배려하는 행동을 하도록 유도할 수 있기 때문에, STEEM의 전체 가치 향상에 기여할 여지도 있습니다.


Sort:  

utopian-io님이 lostmine27님을 멘션하셨습니당. 아래 링크를 누르시면 연결되용~ ^^
utopian-io님의 Top of Utopian.io: February 14 - 21

...c.

Staff PicksThe SBD returns ? by los...

혹시 모르니 그냥 이글에 답니다^^ 확실히 아이디어쪽 리뷰어들 일부는 좀 그렇다는 느낌을 많이 받습니다. 생각보다 제안글이 많지 않은 이유가 맥빠지게 만드는 이들때문이지 않을까 하는 생각도 들 정도로. 물론 모더레이터 시급이 너무 낮기 때문에 이해할 수밖에 없는 부분 같긴 합니다.

공감해주셔서 정말 감사드립니다. ^^
처음 보는 인도 카슈미르에 산다는 모더레이터가 너무 급하게 검토를 한 것 같아서(3일 지나도 안하길래 제가 그에 대해 먼저 한마디 했거든요 ^
^), 처음으로 살짝 클레임을 걸어봤네요.

유토피안의 문제점들에 대해서도 사실 할말이 많지만, 특히 모더레이터 문제 / 번역의 비중이 과다한 문제 등등..더 말해서 무슨 의미가 있나 싶기도 하네요. 절이 싫으면 중이 떠나라는 말이 있듯이요. 아이디어 쪽은 말씀대로 저도 접도록 해야겠습니다.

즐거운 시간 보내세요.

네 요새 아이디어가 리뷰도 늦게 하는 경우가 많고 리뷰의 질이 많이 떨어지는 것 같습니다ㅠㅠ 좋은 제안도 사실 자주 나오지 않는 것같은데 리뷰탓도 있는 것 같고 왠만해선 제안해봐야 허공에 메아리다보니 제안하는 사람도 지치는 면도 없지 않을까 싶습니다.

물론 다 답변을 해주다보면 너무 글이 많이 올라올까봐 그런것도 있겠지만 수많은 프로젝트가 깃허브에도 묵묵부답인 경우가 많으니 솔직히 제안에 대한 자기만족과 막연한 희망 약간의 보팅을 제외하면 아무래도 흥이 좀 안나는 것 같네요. 그런 악순환에 빠져있는듯. 저도 정말 색다르다거나 제가 불편해서 구현까지 한 경우 제외하곤 앞으로 잘 안 쓸 것 같습니다. 주말 잘 보내세요. 감사합니다.

ps. 참 번역은 저도 비중이 좀 높다고 생각하는데 아무래도 정말 고된 일(그야 말로 들인 시간이 있으니)이니까 최대한 보상을 해주려는 의도인 것은 같아요. 의미있는 것을 번역하느냐 보팅을 위한 번역을 하느냐는 사실 잘 모르겠네요ㅎㅎ 특히 해당 프로젝트가 화이트리스트 포함을 위해 유토피안에 기여를 하는바가 있는지를 잘 모르겠네요. 만약 들어가는 조건으로 스파를 임대해야한다던가 뭔가 의무사항이 있다면 탓하긴 힘들것 같고 왠만하면 무상으로 받아주는 거면 전체 할당양이 조금 많은 편인 것 같습니다. 워낙 submission자체가 많고 보상이 너무 낮으면 submission을 안할테니 어쩔수 없는 부분이 있긴할거라 참 어려운 문제네요. 프로젝트가 유토피안 스폰서를 적절히 하는 식이 되면 좋겠네요.

곰돌이가 @lostmine27님의 소중한 댓글에 $0.016을 보팅해서 $0.007을 살려드리고 가요. 곰돌이가 지금까지 총 3387번 $40.321을 보팅해서 $42.263을 구했습니다. @gomdory 곰도뤼~

pennsif님이 lostmine27님을 멘션하셨습니당. 아래 링크를 누르시면 연결되용~ ^^
pennsif님의 SoS Daily News : news about the State of Steem @ 22 February 2019

...mxpfw2q">Steem is Blocked in China and It's My Fault?
lostmine27- <a href="https://steemit.com/utopian-io/lostmine27/analys...

짱짱맨 호출에 응답하였습니다.

본인보다 명성높은분에게 보팅받는게 명성올리기엔 제일 빠른 줄 알았는데 좀 복합적이군요.

https://steemit.com/kr-steemit/@blockchainstudio/vote-unvote-voting-power-reputation

이전에 쓴 글인데 사실 명성도에 직접 영향을 주는 것은 단 하나 보팅금액뿐입니다. @lostmine27 님께서 분석해주신 것도 다른 팩터가 실제 인과관계라는 것은 아니고 상관관계를 분석해주신 것입니다. 예를 들면 정상적인 글을 많이 썼으면 당연히 대체로 보팅받은 금액이 올라가서 명성도가 올라가게 되니 correlation이 있을수밖에 없지요.

보팅해주는 사람의 명성도가 나보다 높은지와는 전혀 무관합니다 (마이너스가 아닌이상). 명성도가 높으면 스파도 높은 경우도 많으니 그렇게 느끼셨을것이고 그런 잘못된 설명글이 제법 있어서 그렇게들 알고 계시는 것 같더라고요. 단 다운보팅때는 깍으려면 명성도가 더 높아야지만 가능합니다. 아마 그것이 스팸클리너등의 계정이 셀봇하는 것에 대한 정당화 사유이기도 할 겁니다. 그래도 가장 높지 못한 것이 현실이지만ㅎㅎ

네 사실 말씀대로 보팅 많이 받는 것이 핵심일테고 특히 명성 높은 계정의 보팅이 있으면 (리스팀/인지도/보유SP 측면 등에서 대체로) 더 좋겠죠. 비드봇으로 인해 reputation왜곡이 있으니, 이것은 본인의 reputation뿐 아니라 결국 타인의 reputation까지 조금 왜곡시킬 수도 있겠네요. 이 문제는 결국 시스템 단위에서 제도적으로 해결해야 할 것 같구요.

사실 몰라도 스팀 혹은 스팀잇 하는데 있어 전혀 지장 없겠구요.

다만 reputation지표가 처음 댄이 만들때와는 달리, 반쪽짜리화된 점에 기초하여 대안적으로 병행할만한 보조지표를 찾다보니, 이런 상관관계 분석을 해보게 되었네요. 상관관계 측면에서 볼 때, 결론적으로는 followers' SP SUM과 post수를 추가로 사용하면 좋겠더군요.

reputation이 61이상인 계정들의 reputation과 11가지 개별요인들이 어느 정도 양의 상관관계가 있는지를 정리해봤고, followers' SP SUM 및 followers가 보팅과 대등한 수준의 상관관계가 나타났다는 점, comment수는 중요하지 않고 post수는 유의미한 정도는 되었다는 점, 의외로 effective SP / owned SP / reward per post 는 상관관계가 약했다는 점, 특히 comment수 reply수는 거의 무관한 수준이었다는 점 등을 캐치해볼 수 있었습니다.

팔로워들의 reputation수준과도 비교해볼까 싶었으나, 오류가능성이 높은 요인이라서 제외했었습니다.

좋은 시간 보내세요. ^_^

blockchainstudio님이 lostmine27님을 멘션하셨습니당. 아래 링크를 누르시면 연결되용~ ^^
blockchainstudio님의 [Busy] cannot edit posts / user page loading fail

...staging version. I also first came to know this problem by lostmine27who let me know this problem, since he knows I'm very activ...

blockchainstudio님이 lostmine27님을 멘션하셨습니당. 아래 링크를 누르시면 연결되용~ ^^
blockchainstudio님의 [Busy] cannot edit posts / user page loading fail

...적용안될테니 미리 걱정하실 필요는 없을 것 같습니다. 처음 해당문제를 제게 알려주신 lostmine27과 bbooaae 님께 감사드리고 이 글 payout되면 소정의 성의 표시를 하겠습니다.
    <li...

    참 이거 저번에도 보면 아이디 뒤에 공백이 없으면 즉 "lostmine27님" 처럼 쓰면 "님"자를 빼먹더라고요ㅎㅎ

    blockchainstudio님이 lostmine27님을 멘션하셨습니당. 아래 링크를 누르시면 연결되용~ ^^
    lostmine27님의 STEEM의 "reputation"을 형성하는 11가지 요인 분석

    ...-reputation
    이전에 쓴 글인데 사실 명성도에 직접 영향을 주는 것은 단 하나 보팅금액뿐입니다. lostmine27님께서 분석해주신 것도 다른 팩터가 실제 인과관계라는 것은 아니고 상관관계를 분석해주신 것입니다. 예를 들...