Spaces:

colab-potsdam
/

clem-leaderboard

Running

App Files Files Community

clem-leaderboard / src /leaderboard_utils.py

sherzod-hakimov

adapted to the new changes in the benchmark list

fa0181f 3 months ago

raw

history blame

5.17 kB

	import os
	import pandas as pd
	import requests
	import json
	from io import StringIO
	from datetime import datetime

	from src.assets.text_content import REPO

	def get_github_data():
	"""
	Read and process data from CSV files hosted on GitHub. - https://github.com/clembench/clembench-runs

	Returns:
	github_data (dict): Dictionary containing:
	- "text": List of DataFrames for each version's textual leaderboard data.
	- "multimodal": List of DataFrames for each version's multimodal leaderboard data.
	- "date": Formatted date of the latest version in "DD Month YYYY" format.
	"""
	base_repo = REPO
	json_url = base_repo + "benchmark_runs.json"
	response = requests.get(json_url)

	# Check if the JSON file request was successful
	if response.status_code != 200:
	print(f"Failed to read JSON file: Status Code: {response.status_code}")
	return None, None, None, None

	json_data = response.json()
	versions = json_data['versions']

	version_names = sorted(
	[ver['version'] for ver in versions],
	key=lambda v: list(map(int, v[1:].split('_')[0].split('.'))),
	reverse=True
	)

	# Get Leaderboard data - for text-only + multimodal
	github_data = {}

	# Collect Dataframes
	text_dfs = []
	mm_dfs = []

	text_flag = True
	text_date = ""
	mm_flag = True
	mm_date = ""

	for version in version_names:
	# Collect CSV data in descending order of clembench-runs versions
	# Collect Text-only data
	if len(version.split('_')) == 1:
	text_url = f"{base_repo}{version}/results.csv"
	csv_response = requests.get(text_url)
	if csv_response.status_code == 200:
	df = pd.read_csv(StringIO(csv_response.text))
	df = process_df(df)
	df = df.sort_values(by=df.columns[1], ascending=False) # Sort by clemscore column
	text_dfs.append(df)
	if text_flag:
	text_flag = False
	text_date = next(ver['date'] for ver in versions if ver['version'] == version)
	text_date = datetime.strptime(text_date, "%Y-%m-%d").strftime("%d %b %Y")

	else:
	print(f"Failed to read Text-only leaderboard CSV file for version: {version}. Status Code: {csv_response.status_code}")

	# Check if version ends with 'multimodal' before constructing the URL
	mm_suffix = "_multimodal" if not version.endswith('multimodal') else ""
	mm_url = f"{base_repo}{version}{mm_suffix}/results.csv"
	mm_response = requests.get(mm_url)
	if mm_response.status_code == 200:
	df = pd.read_csv(StringIO(mm_response.text))
	df = process_df(df)
	df = df.sort_values(by=df.columns[1], ascending=False) # Sort by clemscore column
	mm_dfs.append(df)
	if mm_flag:
	mm_flag = False
	mm_date = next(ver['date'] for ver in versions if ver['version'] == version)
	mm_date = datetime.strptime(mm_date, "%Y-%m-%d").strftime("%d %b %Y")


	github_data["text"] = text_dfs
	github_data["multimodal"] = mm_dfs
	github_data["date"] = text_date
	github_data["mm_date"] = mm_date

	return github_data


	def process_df(df: pd.DataFrame) -> pd.DataFrame:
	"""
	Process dataframe:
	- Convert datatypes to sort by "float" instead of "str"
	- Remove repetition in model names
	- Update column names

	Args:
	df: Unprocessed Dataframe (after using update_cols)

	Returns:
	df: Processed Dataframe
	"""

	# Convert column values to float, apart from the model names column
	for col in df.columns[1:]:
	df[col] = pd.to_numeric(df[col], errors='coerce')

	# Remove repetition in model names
	df[df.columns[0]] = df[df.columns[0]].str.replace('-t0.0', '', regex=True)
	df[df.columns[0]] = df[df.columns[0]].apply(lambda x: '--'.join(set(x.split('--'))))

	# Update column names
	custom_column_names = ['Model', 'Clemscore', '% Played', 'Quality Score']
	for i, col in enumerate(df.columns[4:]): # Start Capitalizing from the 5th column
	parts = col.split(',')
	custom_name = f"{parts[0].strip().capitalize()} {parts[1].strip()}"
	custom_column_names.append(custom_name)

	# Rename columns
	df.columns = custom_column_names

	return df


	def query_search(df: pd.DataFrame, query: str) -> pd.DataFrame:
	"""
	Filter the dataframe based on the search query.

	Args:
	df (pd.DataFrame): Unfiltered dataframe.
	query (str): A string of queries separated by ";".
	Returns:
	pd.DataFrame: Filtered dataframe containing searched queries in the 'Model' column.
	"""
	if not query.strip(): # Reset Dataframe if empty query is passed
	return df

	queries = [q.strip().lower() for q in query.split(';') if q.strip()] # Normalize and split queries

	# Filter dataframe based on queries in 'Model' column
	filtered_df = df[df['Model'].str.lower().str.contains('\|'.join(queries))]

	return filtered_df