mobeigi/reddit_symbol_parser.py

## reddit_symbol_parser.py
import praw
import regex as re

reddit = praw.Reddit(
    client_id="client_id",
    client_secret="client_secret",
    user_agent="MobeigiTest",
)

submission = reddit.submission(id="pfpyxc")
submission.comments.replace_more(limit=0)

symbols = dict()

for top_level_comment in submission.comments.list():

    body = top_level_comment.body

    # Find tickers
    matches = re.findall(r'(^|\s)([A-Z]{1,5})(\s|$)', body, overlapped=True)
    for match in matches:
        symbol = match[1]
        symbols[symbol] = symbols.get(symbol, 0) + 1


# filter out values
filter_list = ['I', 'ETF', 'A', 'IRA', 'US']
symbols = {k:v for k,v in symbols.items() if k not in filter_list}

# Sort by value
sorted_symbols = {k: v for k, v in sorted(symbols.items(), key=lambda item: item[1], reverse=True)}
print(sorted_symbols)
	import praw
	import regex as re

	reddit = praw.Reddit(
	client_id="client_id",
	client_secret="client_secret",
	user_agent="MobeigiTest",
	)

	submission = reddit.submission(id="pfpyxc")
	submission.comments.replace_more(limit=0)

	symbols = dict()

	for top_level_comment in submission.comments.list():

	body = top_level_comment.body

	# Find tickers
	matches = re.findall(r'(^\|\s)([A-Z]{1,5})(\s\|$)', body, overlapped=True)
	for match in matches:
	symbol = match[1]
	symbols[symbol] = symbols.get(symbol, 0) + 1


	# filter out values
	filter_list = ['I', 'ETF', 'A', 'IRA', 'US']
	symbols = {k:v for k,v in symbols.items() if k not in filter_list}

	# Sort by value
	sorted_symbols = {k: v for k, v in sorted(symbols.items(), key=lambda item: item[1], reverse=True)}
	print(sorted_symbols)